d0rj/rlhf-reward-datasets-ru

Name: d0rj/rlhf-reward-datasets-ru
Creator: d0rj
Published: 2024-07-02 07:39:32
License: 暂无描述

Hugging Face2024-07-02 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/d0rj/rlhf-reward-datasets-ru

下载链接

链接失效反馈

官方服务：

资源简介：

这是[yitingxie/rlhf-reward-datasets](https://huggingface.co/datasets/yitingxie/rlhf-reward-datasets)数据集的俄语翻译版本，主要用于人类反馈、ChatGPT、奖励和DPO（Direct Preference Optimization）等领域。数据集包含训练集和测试集，训练集有76256个样本，测试集有5103个样本。

提供机构：

d0rj

原始信息汇总

数据集概述

基本信息

名称: HH for RLHF (ru)
语言: 俄语 (ru)
多语言性: 单语种
大小: 10K<n<100K
许可证: MIT

数据集内容

特征:
- prompt: 数据类型为字符串
- chosen: 数据类型为字符串
- rejected: 数据类型为字符串

数据分割

训练集:
- 示例数量: 76256
- 存储大小: 151564655.0字节
测试集:
- 示例数量: 5103
- 存储大小: 6093563.0字节

下载与数据集大小

下载大小: 78860063字节
数据集总大小: 157658218.0字节

5,000+

优质数据集

54 个

任务类型

进入经典数据集