meg-tong/sycophancy-eval

Name: meg-tong/sycophancy-eval
Creator: meg-tong
Published: 2023-10-23 18:24:54
License: 暂无描述

Hugging Face2023-10-23 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/meg-tong/sycophancy-eval

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个GitHub仓库的数据镜像，旨在评估语言模型在不同自由文本生成任务中的奉承行为。数据集来源于论文《Towards Understanding Sycophancy in Language Models》，并包含了用于评估的代码示例。

提供机构：

meg-tong

原始信息汇总

SycophancyEval

概述

SycophancyEval 数据集旨在评估语言模型在各种自由形式文本生成任务中的谄媚行为，源自论文《Towards Understanding Sycophancy in Language Models》。

许可

该数据集遵循 MIT 许可。

任务类别

文本生成
问答

语言

英语

数据集大小

数据量小于1K

引用

如需引用该数据集或相关工作，请使用以下 BibTeX 格式：

@misc{sharma2023understanding, title={Towards Understanding Sycophancy in Language Models}, author={Mrinank Sharma and Meg Tong and Tomasz Korbak and David Duvenaud and Amanda Askell and Samuel R. Bowman and Newton Cheng and Esin Durmus and Zac Hatfield-Dodds and Scott R. Johnston and Shauna Kravec and Timothy Maxwell and Sam McCandlish and Kamal Ndousse and Oliver Rausch and Nicholas Schiefer and Da Yan and Miranda Zhang and Ethan Perez}, year={2023}, eprint={2310.13548}, archivePrefix={arXiv}, primaryClass={cs.CL} }

5,000+

优质数据集

54 个

任务类型

进入经典数据集