llm-jp/hh-rlhf-12k-ja

Name: llm-jp/hh-rlhf-12k-ja
Creator: llm-jp
Published: 2024-02-04 21:45:59
License: 暂无描述

Hugging Face2024-02-04 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/llm-jp/hh-rlhf-12k-ja

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是由日本合作项目LLM-jp开发的人类偏好数据集。它是hh-rlhf数据集的日语翻译版本，包含从hh-rlhf中随机抽取的12,000条数据。具体来说，这些数据是从四个组（无害基础、有帮助基础、有帮助在线、有帮助拒绝采样）的训练集中各随机选取3,000条数据组成的。

提供机构：

llm-jp

原始信息汇总

hh-rlhf-12k-ja

来源: 该数据集是hh-rlhf的一个子集的日语翻译，使用DeepL进行翻译。
数据条目: 包含12,000条随机抽样的数据。
数据组成: 从hh-rlhf的四个训练分组中随机选择3,000条数据，包括harmless-base、helpful-base、helpful-online和helpful-rejection-sampled。

5,000+

优质数据集

54 个

任务类型

进入经典数据集