five

llm-jp/hh-rlhf-12k-ja

收藏
Hugging Face2024-02-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/llm-jp/hh-rlhf-12k-ja
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是由日本合作项目LLM-jp开发的人类偏好数据集。它是hh-rlhf数据集的日语翻译版本,包含从hh-rlhf中随机抽取的12,000条数据。具体来说,这些数据是从四个组(无害基础、有帮助基础、有帮助在线、有帮助拒绝采样)的训练集中各随机选取3,000条数据组成的。

该数据集是由日本合作项目LLM-jp开发的人类偏好数据集。它是hh-rlhf数据集的日语翻译版本,包含从hh-rlhf中随机抽取的12,000条数据。具体来说,这些数据是从四个组(无害基础、有帮助基础、有帮助在线、有帮助拒绝采样)的训练集中各随机选取3,000条数据组成的。
提供机构:
llm-jp
原始信息汇总

hh-rlhf-12k-ja

概述

  • 数据集名称: hh-rlhf-12k-ja
  • 开发机构: LLM-jp(日本合作项目)
  • 语言: 日语
  • 数据集规模: 10K<n<100K
  • 许可协议: MIT

数据集详情

  • 来源: 该数据集是hh-rlhf的一个子集的日语翻译,使用DeepL进行翻译。
  • 数据条目: 包含12,000条随机抽样的数据。
  • 数据组成: 从hh-rlhf的四个训练分组中随机选择3,000条数据,包括harmless-base、helpful-base、helpful-online和helpful-rejection-sampled。

联系信息

  • 问题反馈: llm-jp(at)nii.ac.jp

模型卡作者

  • 作者名单按字母顺序排列:
    • Hirokazu Kiyomaru
    • Hiroshi Matsuda
    • Jun Suzuki
    • Namgi Han
    • Saku Sugawara
    • Shota Sasaki
    • Shuhei Kurita
    • Taishi Nakamura
    • Takashi Kodama
    • Takumi Okamoto
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作