kunishou/hh-rlhf-49k-ja-single-turn
收藏Hugging Face2023-11-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/kunishou/hh-rlhf-49k-ja-single-turn
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是通过自动翻译Anthropic/hh-rlhf数据集的一部分到日语,并选择了单轮对话内容创建的。该数据集可用于RLHF(人类反馈强化学习)和DPO(直接偏好优化)。
提供机构:
kunishou
原始信息汇总
数据集概述
数据集来源
- 该数据集是通过自动将部分 "Anthropic/hh-rlhf" 数据集翻译成日语创建的。
数据集用途
- 该数据集适用于单轮对话场景。
- 可用于强化学习从人类反馈(RLHF)和直接偏好优化(DPO)。
相关链接
- 原始数据集 "Anthropic/hh-rlhf" 链接:Anthropic/hh-rlhf



