meg-tong/sycophancy-eval
收藏Hugging Face2023-10-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/meg-tong/sycophancy-eval
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个GitHub仓库的数据镜像,旨在评估语言模型在不同自由文本生成任务中的奉承行为。数据集来源于论文《Towards Understanding Sycophancy in Language Models》,并包含了用于评估的代码示例。
提供机构:
meg-tong
原始信息汇总
SycophancyEval
概述
SycophancyEval 数据集旨在评估语言模型在各种自由形式文本生成任务中的谄媚行为,源自论文《Towards Understanding Sycophancy in Language Models》。
许可
该数据集遵循 MIT 许可。
任务类别
- 文本生成
- 问答
语言
- 英语
数据集大小
- 数据量小于1K
引用
如需引用该数据集或相关工作,请使用以下 BibTeX 格式:
@misc{sharma2023understanding, title={Towards Understanding Sycophancy in Language Models}, author={Mrinank Sharma and Meg Tong and Tomasz Korbak and David Duvenaud and Amanda Askell and Samuel R. Bowman and Newton Cheng and Esin Durmus and Zac Hatfield-Dodds and Scott R. Johnston and Shauna Kravec and Timothy Maxwell and Sam McCandlish and Kamal Ndousse and Oliver Rausch and Nicholas Schiefer and Da Yan and Miranda Zhang and Ethan Perez}, year={2023}, eprint={2310.13548}, archivePrefix={arXiv}, primaryClass={cs.CL} }



