MetaAligner/HH-RLHF-MetaAligner-Data
收藏Hugging Face2024-04-30 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/MetaAligner/HH-RLHF-MetaAligner-Data
下载链接
链接失效反馈官方服务:
资源简介:
该数据集提供了来自HH-RLHF的MetaAligner数据的两个子集:1. equal-preference子集,包含在equal_train.json和equal_val.json文件中;2. preference子集,包含在preference_train.json、preference_val.json和preference_test.json文件中。需要注意的是,由于对话数据来自HH-RLHF,数据可能包含令人不适的内容,如歧视性语言、虐待、暴力、自残、剥削等话题。数据仅用于研究目的,特别是减少模型有害性的研究。
该数据集提供了来自HH-RLHF的MetaAligner数据的两个子集:1. equal-preference子集,包含在equal_train.json和equal_val.json文件中;2. preference子集,包含在preference_train.json、preference_val.json和preference_test.json文件中。需要注意的是,由于对话数据来自HH-RLHF,数据可能包含令人不适的内容,如歧视性语言、虐待、暴力、自残、剥削等话题。数据仅用于研究目的,特别是减少模型有害性的研究。
提供机构:
MetaAligner
原始信息汇总
数据集卡片 for HH-RLHF-MetaAligner-Data
数据集概述
本仓库提供从HH-RLHF构建的MetaAligner数据的两个子集:
- 等偏好子集包含在:
equal_train.json和equal_val.json。 - 偏好子集包含在:
preference_train.json、preference_val.json和preference_test.json。
免责声明:由于对话数据来自HH-RLHF,数据可能包含令人不快或冒犯性的内容。主题包括但不限于歧视性语言和对虐待、暴力、自残、剥削及其他可能令人不快的话题的讨论。请仅在您个人风险承受范围内与数据互动。数据旨在用于研究目的,特别是可以减少模型危害的研究。
使用方法
每个上述数据集位于单独的子目录中。要加载单个子集,请使用load_dataset()函数的data_dir参数,如下所示:
python from datasets import load_dataset
加载偏好子集
data_files = {"train": "preference_train.json", "validation": "preference_val.json", "test": "preference_test.json"} preference_dataset = load_dataset(MetaAligner/HH-RLHF-MetaAligner-Data, data_files=data_files)
加载等偏好子集
data_files = {"train": "equal_train.json", "validation": "equal_val.json"} equal_dataset = load_dataset(MetaAligner/HH-RLHF-MetaAligner-Data, data_files=data_files)



