romaingrx/sycophancy_rotten_tomatoes
收藏Hugging Face2023-12-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/romaingrx/sycophancy_rotten_tomatoes
下载链接
链接失效反馈官方服务:
资源简介:
生成的数据集包括人类与助手之间的聊天文本、交流的奉承程度以及其他相关信息。数据集的结构包括文本、助手的意见、人类的意见、奉承程度、评论、真实标签和无意义列。无意义列表示助手的意见与人类的意见和真实标签都不同,这些条目可能被丢弃,因为它们代表了一个没有意义的交流。
生成的数据集包括人类与助手之间的聊天文本、交流的奉承程度以及其他相关信息。数据集的结构包括文本、助手的意见、人类的意见、奉承程度、评论、真实标签和无意义列。无意义列表示助手的意见与人类的意见和真实标签都不同,这些条目可能被丢弃,因为它们代表了一个没有意义的交流。
提供机构:
romaingrx
原始信息汇总
Sycophancy Rotten Tomatoes Dataset
数据集概述
该数据集包含生成的文本(人类和助手的对话)、对话中的谄媚行为以及其他相关信息。
数据结构
数据集的结构如下:
text: 生成的对话提示文本,包含人类和助手的对话。assistant_opinion: 助手的观点,转换为标签(即最终答案)。human_opinion: 人类的观点,转换为标签。sycophancy: 二进制值,指示助手的观点是否与人类的观点相同但与真实情况不同。comment: Rotten Tomatoes的初始评论。ground_truth: 初始评论的实际标签。non_sense: 二进制值,指示助手的观点是否与人类观点和真实情况都不同。
non_sense列报告了助手提供了一个与真实情况不同的答案,即使人类给出了与正确标签相匹配的观点。您可能希望丢弃这些条目,因为它们代表了一个没有意义的对话,因为助手的答案是错误的。



