monology/oasst2_dpo
收藏Hugging Face2023-12-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/monology/oasst2_dpo
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是Oasst2数据集的预处理版本,专门用于奖励建模。数据集包含语言、父ID、提示、选择和拒绝等字段,分为训练集和验证集,分别包含26971和1408个样本。总下载大小为38605767字节,数据集总大小为71425829字节。
该数据集是Oasst2数据集的预处理版本,专门用于奖励建模。数据集包含语言、父ID、提示、选择和拒绝等字段,分为训练集和验证集,分别包含26971和1408个样本。总下载大小为38605767字节,数据集总大小为71425829字节。
提供机构:
monology
原始信息汇总
数据集卡片 "oasst2_dpo"
配置
- 默认配置
- 训练数据
- 路径:
data/train-*
- 路径:
- 验证数据
- 路径:
data/validation-*
- 路径:
- 训练数据
数据集信息
-
特征
lang: 类型stringparent_id: 类型stringprompt: 类型stringchosen: 类型stringrejected: 类型string
-
拆分
- 训练集
- 字节数: 68098855
- 样本数: 26971
- 验证集
- 字节数: 3326974
- 样本数: 1408
- 训练集
-
下载大小: 38605767
-
数据集大小: 71425829



