d0rj/rlhf-reward-datasets-ru
收藏Hugging Face2024-07-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/d0rj/rlhf-reward-datasets-ru
下载链接
链接失效反馈官方服务:
资源简介:
这是[yitingxie/rlhf-reward-datasets](https://huggingface.co/datasets/yitingxie/rlhf-reward-datasets)数据集的俄语翻译版本,主要用于人类反馈、ChatGPT、奖励和DPO(Direct Preference Optimization)等领域。数据集包含训练集和测试集,训练集有76256个样本,测试集有5103个样本。
提供机构:
d0rj
原始信息汇总
数据集概述
基本信息
- 名称: HH for RLHF (ru)
- 语言: 俄语 (ru)
- 多语言性: 单语种
- 大小: 10K<n<100K
- 许可证: MIT
数据集内容
- 特征:
- prompt: 数据类型为字符串
- chosen: 数据类型为字符串
- rejected: 数据类型为字符串
数据分割
- 训练集:
- 示例数量: 76256
- 存储大小: 151564655.0字节
- 测试集:
- 示例数量: 5103
- 存储大小: 6093563.0字节
下载与数据集大小
- 下载大小: 78860063字节
- 数据集总大小: 157658218.0字节



