MetaAligner/HH-RLHF-MetaAligner-Data

Name: MetaAligner/HH-RLHF-MetaAligner-Data
Creator: MetaAligner
Published: 2024-04-30 14:25:49
License: 暂无描述

Hugging Face2024-04-30 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/MetaAligner/HH-RLHF-MetaAligner-Data

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集提供了来自HH-RLHF的MetaAligner数据的两个子集：1. equal-preference子集，包含在equal_train.json和equal_val.json文件中；2. preference子集，包含在preference_train.json、preference_val.json和preference_test.json文件中。需要注意的是，由于对话数据来自HH-RLHF，数据可能包含令人不适的内容，如歧视性语言、虐待、暴力、自残、剥削等话题。数据仅用于研究目的，特别是减少模型有害性的研究。

提供机构：

MetaAligner

原始信息汇总

数据集卡片 for HH-RLHF-MetaAligner-Data

数据集概述

本仓库提供从HH-RLHF构建的MetaAligner数据的两个子集：

等偏好子集包含在：equal_train.json 和 equal_val.json。
偏好子集包含在：preference_train.json、preference_val.json 和 preference_test.json。

免责声明：由于对话数据来自HH-RLHF，数据可能包含令人不快或冒犯性的内容。主题包括但不限于歧视性语言和对虐待、暴力、自残、剥削及其他可能令人不快的话题的讨论。请仅在您个人风险承受范围内与数据互动。数据旨在用于研究目的，特别是可以减少模型危害的研究。

使用方法

每个上述数据集位于单独的子目录中。要加载单个子集，请使用load_dataset()函数的data_dir参数，如下所示：

python from datasets import load_dataset

加载偏好子集

data_files = {"train": "preference_train.json", "validation": "preference_val.json", "test": "preference_test.json"} preference_dataset = load_dataset(MetaAligner/HH-RLHF-MetaAligner-Data, data_files=data_files)

加载等偏好子集

data_files = {"train": "equal_train.json", "validation": "equal_val.json"} equal_dataset = load_dataset(MetaAligner/HH-RLHF-MetaAligner-Data, data_files=data_files)

5,000+

优质数据集

54 个

任务类型

进入经典数据集