llm-jp/hh-rlhf-12k-ja
收藏Hugging Face2024-02-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/llm-jp/hh-rlhf-12k-ja
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是由日本合作项目LLM-jp开发的人类偏好数据集。它是hh-rlhf数据集的日语翻译版本,包含从hh-rlhf中随机抽取的12,000条数据。具体来说,这些数据是从四个组(无害基础、有帮助基础、有帮助在线、有帮助拒绝采样)的训练集中各随机选取3,000条数据组成的。
该数据集是由日本合作项目LLM-jp开发的人类偏好数据集。它是hh-rlhf数据集的日语翻译版本,包含从hh-rlhf中随机抽取的12,000条数据。具体来说,这些数据是从四个组(无害基础、有帮助基础、有帮助在线、有帮助拒绝采样)的训练集中各随机选取3,000条数据组成的。
提供机构:
llm-jp
原始信息汇总
hh-rlhf-12k-ja
概述
- 数据集名称: hh-rlhf-12k-ja
- 开发机构: LLM-jp(日本合作项目)
- 语言: 日语
- 数据集规模: 10K<n<100K
- 许可协议: MIT
数据集详情
- 来源: 该数据集是hh-rlhf的一个子集的日语翻译,使用DeepL进行翻译。
- 数据条目: 包含12,000条随机抽样的数据。
- 数据组成: 从hh-rlhf的四个训练分组中随机选择3,000条数据,包括harmless-base、helpful-base、helpful-online和helpful-rejection-sampled。
联系信息
- 问题反馈: llm-jp(at)nii.ac.jp
模型卡作者
- 作者名单按字母顺序排列:
- Hirokazu Kiyomaru
- Hiroshi Matsuda
- Jun Suzuki
- Namgi Han
- Saku Sugawara
- Shota Sasaki
- Shuhei Kurita
- Taishi Nakamura
- Takashi Kodama
- Takumi Okamoto



