fedyanin/hh-rlhf-formatted
收藏Hugging Face2024-04-03 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/fedyanin/hh-rlhf-formatted
下载链接
链接失效反馈官方服务:
资源简介:
这是一个Anthropic的hh-rlhf安全数据集的版本,专门解析用于聊天模板。数据集包含训练和测试两个分割,分别有160,800和8,552个例子,总下载大小为184,692,118字节,数据集大小为332,752,300字节。
这是一个Anthropic的hh-rlhf安全数据集的版本,专门解析用于聊天模板。数据集包含训练和测试两个分割,分别有160,800和8,552个例子,总下载大小为184,692,118字节,数据集大小为332,752,300字节。
提供机构:
fedyanin
原始信息汇总
数据集概述
数据集特征
-
chosen
- content: 数据类型为字符串
- role: 数据类型为字符串
-
rejected
- content: 数据类型为字符串
- role: 数据类型为字符串
数据集分割
-
train
- num_bytes: 315800721
- num_examples: 160800
-
test
- num_bytes: 16951579
- num_examples: 8552
数据集大小
- download_size: 184692118
- dataset_size: 332752300
配置文件
- config_name: default
- data_files
- train: 路径为 data/train-*
- test: 路径为 data/test-*



