Anthropic/hh-rlhf
收藏数据集卡片 for HH-RLHF
数据集概述
本仓库提供两种不同类型的数据:
- 关于帮助性和无害性的人类偏好数据,来自论文《Training a Helpful and Harmless Assistant with Reinforcement Learning from Human Feedback》。这些数据旨在用于后续RLHF训练的偏好(或奖励)模型训练,不适用于对话代理的监督训练。
- 来自《Red Teaming Language Models to Reduce Harms: Methods, Scaling Behaviors, and Lessons Learned》的人类生成和注释的红队对话数据。这些数据旨在理解人群工作者如何红队模型以及哪些类型的红队攻击是成功的或不成功的,不适用于微调或偏好建模。
免责声明:数据(尤其是无害性偏好数据和红队数据)包含可能令人反感或不安的内容。主题包括但不限于歧视性语言和关于虐待、暴力、自残、剥削和其他可能令人不安的主题的讨论。请仅根据您个人的风险承受能力与数据互动。数据旨在用于研究目的,特别是可以减少模型危害的研究。数据中的观点不代表Anthropic或其员工的观点。
关于帮助性和无害性的人类偏好数据(PM数据)
数据格式非常简单,每个jsonl文件的每一行包含一对文本,一个是“chosen”,另一个是“rejected”。
- 帮助性:数据分为三个部分:基础模型(上下文蒸馏的52B语言模型)、拒绝抽样(主要使用best-of-16抽样)和迭代“在线”过程的抽样数据。
- 无害性:数据仅从基础模型收集,格式相同。
数据收集过程和人群工作者群体的详细信息可在论文的第2节和附录D中找到。
红队数据(非PM数据)
每个jsonl文件的每一行包含一个字典,字段包括:
transcript
:人类对手(红队成员)和AI助手之间的对话记录。min_harmlessness_score_transcript
:AI助手的无害性得分(越低越有害)。num_params
:驱动AI助手的语言模型的参数数量。model_type
:驱动AI助手的模型类型。rating
:红队成员对成功破坏AI助手的评级(Likert量表,越高越成功)。task_description
:红队成员关于如何尝试红队AI助手的简短描述。task_description_harmlessness_score
:任务描述的无害性得分(越低越有害)。red_team_member_id
:红队成员的任意标识符。is_upworker
:红队成员是否来自Upwork平台的二进制指示符。tags
:每个对话记录的最多6个标签,描述红队尝试。
数据和数据收集程序的详细信息可在论文的附录中的Datasheet中找到。
使用方法
每个数据集位于单独的子目录中。加载单个子集的方法如下:
python from datasets import load_dataset
加载所有帮助性/无害性子集(共享相同的模式)
dataset = load_dataset("Anthropic/hh-rlhf")
加载其中一个无害性子集
dataset = load_dataset("Anthropic/hh-rlhf", data_dir="harmless-base")
加载红队子集
dataset = load_dataset("Anthropic/hh-rlhf", data_dir="red-team-attempts")

Literature Database, XML, NBVC, Oct 2017
Literature Database, XML format, the Natural Resources of Naval Base Ventura County
Mendeley Data 收录
BBGRE
The Brain & Body Genetic Resource Exchange (BBGRE) provides a resource for investigating the genetic basis of neurodisability. It combines phenotype information from patients with neurodevelopmental and behavioural problems with clinical genetic data, and displays this information on the human genome map.
国家生物信息中心 收录
The MaizeGDB
The MaizeGDB(Maize Genetics and Genomics Database)是一个专门为玉米(Zea mays)基因组学研究提供数据和工具的在线资源。该数据库包含了玉米的基因组序列、基因注释、遗传图谱、突变体信息、表达数据、以及与玉米相关的文献和研究工具。MaizeGDB旨在支持玉米遗传学和基因组学的研究,为科学家提供了一个集成的平台来访问和分析玉米的遗传和基因组数据。
www.maizegdb.org 收录
CTD (Comparative Toxicogenomics Database)
CTD是一个综合性的数据库,旨在通过整合基因、化学物质、疾病和环境暴露的数据,来促进对环境因素与人类疾病之间关系的理解。该数据库包括化学物质与基因的相互作用、化学物质与疾病的关联、基因与疾病的关联以及化学物质与环境暴露的关联。CTD还提供数据下载、API访问和在线查询工具。
ctdbase.org 收录
QM9
QM9数据集包含134k个有机小分子化合物的量子化学计算结果,涵盖了12个量子化学性质,如分子能量、电离能、电子亲和能等。
quantum-machine.org 收录