kira/math-dpo
收藏Hugging Face2024-07-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/kira/math-dpo
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含训练集和测试集,训练集有2393个样本,测试集有25个样本。每个样本包含元数据、选择的评分、拒绝的评分、提示、选择的文本和拒绝的文本。数据集的下载大小为3135711字节,总大小为7049182.0字节。数据集标签为dpo,可能与数据偏好优化相关。
The dataset includes a training set and a test set, with 2393 samples in the training set and 25 samples in the test set. Each sample contains metadata, chosen rating, rejected rating, prompt, chosen text, and rejected text. The download size of the dataset is 3135711 bytes, and the total size is 7049182.0 bytes. The dataset is tagged with dpo, which may be related to data preference optimization.
提供机构:
kira
原始信息汇总
数据集概述
数据集特征
- metadata: 字符串类型
- chosen_rating: 浮点数类型 (float64)
- rejected_rating: 浮点数类型 (float64)
- prompt: 字符串类型
- chosen: 字符串类型
- rejected: 字符串类型
数据集分割
- train:
- 字节数: 6976299.638544251
- 样本数: 2393
- test:
- 字节数: 72882.36145574856
- 样本数: 25
数据集大小
- 下载大小: 3135711 字节
- 数据集大小: 7049182.0 字节
配置
- default:
- 训练数据文件路径:
data/train-* - 测试数据文件路径:
data/test-*
- 训练数据文件路径:



