five

MetaAligner/HH-RLHF-MetaAligner-Data

收藏
Hugging Face2024-04-30 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/MetaAligner/HH-RLHF-MetaAligner-Data
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集提供了来自HH-RLHF的MetaAligner数据的两个子集:1. equal-preference子集,包含在equal_train.json和equal_val.json文件中;2. preference子集,包含在preference_train.json、preference_val.json和preference_test.json文件中。需要注意的是,由于对话数据来自HH-RLHF,数据可能包含令人不适的内容,如歧视性语言、虐待、暴力、自残、剥削等话题。数据仅用于研究目的,特别是减少模型有害性的研究。

该数据集提供了来自HH-RLHF的MetaAligner数据的两个子集:1. equal-preference子集,包含在equal_train.json和equal_val.json文件中;2. preference子集,包含在preference_train.json、preference_val.json和preference_test.json文件中。需要注意的是,由于对话数据来自HH-RLHF,数据可能包含令人不适的内容,如歧视性语言、虐待、暴力、自残、剥削等话题。数据仅用于研究目的,特别是减少模型有害性的研究。
提供机构:
MetaAligner
原始信息汇总

数据集卡片 for HH-RLHF-MetaAligner-Data

数据集概述

本仓库提供从HH-RLHF构建的MetaAligner数据的两个子集:

  1. 等偏好子集包含在:equal_train.jsonequal_val.json
  2. 偏好子集包含在:preference_train.jsonpreference_val.jsonpreference_test.json

免责声明:由于对话数据来自HH-RLHF,数据可能包含令人不快或冒犯性的内容。主题包括但不限于歧视性语言和对虐待、暴力、自残、剥削及其他可能令人不快的话题的讨论。请仅在您个人风险承受范围内与数据互动。数据旨在用于研究目的,特别是可以减少模型危害的研究。

使用方法

每个上述数据集位于单独的子目录中。要加载单个子集,请使用load_dataset()函数的data_dir参数,如下所示:

python from datasets import load_dataset

加载偏好子集

data_files = {"train": "preference_train.json", "validation": "preference_val.json", "test": "preference_test.json"} preference_dataset = load_dataset(MetaAligner/HH-RLHF-MetaAligner-Data, data_files=data_files)

加载等偏好子集

data_files = {"train": "equal_train.json", "validation": "equal_val.json"} equal_dataset = load_dataset(MetaAligner/HH-RLHF-MetaAligner-Data, data_files=data_files)

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作