jan-hq/openmath_instruct_dpo_binarized
收藏Hugging Face2024-02-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/jan-hq/openmath_instruct_dpo_binarized
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含对话数据,分为messages、chosen和rejected三个主要特征。每个特征都是一个列表,列表中包含content和role两个字段,数据类型均为字符串。数据集分为训练集和测试集,训练集包含1,640,641个样本,测试集包含182,294个样本。数据集的下载大小为1,601,938,768字节,数据集总大小为3,534,618,297字节。
该数据集包含对话数据,分为messages、chosen和rejected三个主要特征。每个特征都是一个列表,列表中包含content和role两个字段,数据类型均为字符串。数据集分为训练集和测试集,训练集包含1,640,641个样本,测试集包含182,294个样本。数据集的下载大小为1,601,938,768字节,数据集总大小为3,534,618,297字节。
提供机构:
jan-hq
原始信息汇总
数据集信息
特征
- messages
- content: 数据类型为字符串
- role: 数据类型为字符串
- chosen
- content: 数据类型为字符串
- role: 数据类型为字符串
- rejected
- content: 数据类型为字符串
- role: 数据类型为字符串
数据分割
- train
- 字节数: 3181155497.814446
- 样本数: 1640641
- test
- 字节数: 353462799.1855541
- 样本数: 182294
数据大小
- 下载大小: 1601938768 字节
- 数据集大小: 3534618297.0 字节
配置
- default
- train
- 路径: data/train-*
- test
- 路径: data/test-*
- train



