orion-research/iter2_score-iter2
收藏Hugging Face2024-07-12 更新2024-07-13 收录
下载链接:
https://hf-mirror.com/datasets/orion-research/iter2_score-iter2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含两个主要部分:chosen和rejected,每个部分都包含content和role两个字段,数据类型均为字符串。此外,数据集还包含chosen_probs、chosen_probs_win和chosen_probs_lose三个字段,数据类型为float64。数据集分为训练集和测试集,训练集包含3207个样本,测试集包含321个样本。数据集的下载大小为8540572字节,总大小为15531261字节。
The dataset includes multiple features such as chosen and rejected, each containing content and role fields of string type. Additionally, there are chosen_probs, chosen_probs_win, and chosen_probs_lose fields of float64 type. The dataset is divided into training and test sets, containing 3207 and 321 samples respectively. The download size of the dataset is 8540572 bytes, with a total size of 15531261 bytes.
提供机构:
orion-research
原始信息汇总
数据集概述
数据集特征
- chosen:
- content: 数据类型为字符串
- role: 数据类型为字符串
- rejected:
- content: 数据类型为字符串
- role: 数据类型为字符串
- chosen_probs: 数据类型为float64
- chosen_probs_win: 数据类型为float64
- chosen_probs_lose: 数据类型为float64
数据集划分
- train:
- 字节数: 14094760
- 样本数: 3207
- test:
- 字节数: 1436501
- 样本数: 321
数据集大小
- 下载大小: 8540572 字节
- 数据集总大小: 15531261 字节
配置
- config_name: default
- data_files:
- train: 路径为
data/train-* - test: 路径为
data/test-*
- train: 路径为
- data_files:



