Anthropic/hh-rlhf
收藏数据集卡片 for HH-RLHF
数据集概述
本仓库提供两种不同类型的数据:
- 关于帮助性和无害性的人类偏好数据,来自论文《Training a Helpful and Harmless Assistant with Reinforcement Learning from Human Feedback》。这些数据旨在用于后续RLHF训练的偏好(或奖励)模型训练,不适用于对话代理的监督训练。
- 来自《Red Teaming Language Models to Reduce Harms: Methods, Scaling Behaviors, and Lessons Learned》的人类生成和注释的红队对话数据。这些数据旨在理解人群工作者如何红队模型以及哪些类型的红队攻击是成功的或不成功的,不适用于微调或偏好建模。
免责声明:数据(尤其是无害性偏好数据和红队数据)包含可能令人反感或不安的内容。主题包括但不限于歧视性语言和关于虐待、暴力、自残、剥削和其他可能令人不安的主题的讨论。请仅根据您个人的风险承受能力与数据互动。数据旨在用于研究目的,特别是可以减少模型危害的研究。数据中的观点不代表Anthropic或其员工的观点。
关于帮助性和无害性的人类偏好数据(PM数据)
数据格式非常简单,每个jsonl文件的每一行包含一对文本,一个是“chosen”,另一个是“rejected”。
- 帮助性:数据分为三个部分:基础模型(上下文蒸馏的52B语言模型)、拒绝抽样(主要使用best-of-16抽样)和迭代“在线”过程的抽样数据。
- 无害性:数据仅从基础模型收集,格式相同。
数据收集过程和人群工作者群体的详细信息可在论文的第2节和附录D中找到。
红队数据(非PM数据)
每个jsonl文件的每一行包含一个字典,字段包括:
transcript
:人类对手(红队成员)和AI助手之间的对话记录。min_harmlessness_score_transcript
:AI助手的无害性得分(越低越有害)。num_params
:驱动AI助手的语言模型的参数数量。model_type
:驱动AI助手的模型类型。rating
:红队成员对成功破坏AI助手的评级(Likert量表,越高越成功)。task_description
:红队成员关于如何尝试红队AI助手的简短描述。task_description_harmlessness_score
:任务描述的无害性得分(越低越有害)。red_team_member_id
:红队成员的任意标识符。is_upworker
:红队成员是否来自Upwork平台的二进制指示符。tags
:每个对话记录的最多6个标签,描述红队尝试。
数据和数据收集程序的详细信息可在论文的附录中的Datasheet中找到。
使用方法
每个数据集位于单独的子目录中。加载单个子集的方法如下:
python from datasets import load_dataset
加载所有帮助性/无害性子集(共享相同的模式)
dataset = load_dataset("Anthropic/hh-rlhf")
加载其中一个无害性子集
dataset = load_dataset("Anthropic/hh-rlhf", data_dir="harmless-base")
加载红队子集
dataset = load_dataset("Anthropic/hh-rlhf", data_dir="red-team-attempts")

AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
CBIS-DDSM
该数据集用于训练乳腺癌分类器或分割模型,包含3103张乳腺X光片,其中465张有多个异常。数据集分为训练集和测试集,还包括3568张裁剪的乳腺X光片和对应的掩码。
github 收录
Stanford Cars
Cars数据集包含196类汽车的16,185图像。数据被分成8,144训练图像和8,041测试图像,其中每个类被大致分成50-50。类别通常在品牌,型号,年份,例如2012特斯拉Model S或2012 BMW M3 coupe的级别。
OpenDataLab 收录
中国高分辨率高质量PM2.5数据集(2000-2023)
ChinaHighPM2.5数据集是中国高分辨率高质量近地表空气污染物数据集(ChinaHighAirPollutants, CHAP)中PM2.5数据集。该数据集利用人工智能技术,使用模式资料填补了卫星MODIS MAIAC AOD产品的空间缺失值,结合地基观测、大气再分析和排放清单等大数据生产得到2000年至今全国无缝隙地面PM2.5数据。数据十折交叉验证决定系数R2为0.92,均方根误差RMSE为10.76 µg/m3。主要范围为整个中国地区,空间分辨率为1 km,时间分辨率为日、月、年,单位为µg/m3。注意:该数据集持续更新,如需要更多数据,请发邮件联系作者(weijing_rs@163.com; weijing@umd.edu)。 数据文件中包含NC转GeoTiff的四种代码(Python、Matlab、IDL和R语言)nc2geotiff codes。
国家青藏高原科学数据中心 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录