Xalphinions/UltraFeedback_with_tie_strict
收藏Hugging Face2024-07-11 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Xalphinions/UltraFeedback_with_tie_strict
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含训练集和测试集,主要用于比较和选择模型输出。每个样本包含chosen和rejected两个选项,每个选项有content和role两个字段,分别表示内容和角色。此外,每个样本还包含一个prompt字段和一个tie字段,prompt用于提示模型生成内容,tie用于标识是否两个选项质量相当。训练集包含64085个样本,测试集包含1000个样本。
This dataset includes training and test sets, primarily used for comparing and selecting model outputs. Each sample contains chosen and rejected options, each with content and role fields, representing the content and role respectively. Additionally, each sample includes a prompt field and a tie field, where prompt is used to prompt the model to generate content, and tie indicates whether the quality of the two options is comparable. The training set contains 64,085 samples, and the test set contains 1,000 samples.
提供机构:
Xalphinions
原始信息汇总
数据集概述
数据集信息
特征
- chosen:
- content: 数据类型为
string - role: 数据类型为
string
- content: 数据类型为
- rejected:
- content: 数据类型为
string - role: 数据类型为
string
- content: 数据类型为
- prompt: 数据类型为
string - tie: 数据类型为
int64
数据分割
- train:
- 字节数: 380244988
- 样本数: 64085
- test:
- 字节数: 5880964
- 样本数: 1000
数据大小
- 下载大小: 120535160 字节
- 数据集大小: 386125952 字节
配置
- config_name: default
- data_files:
- train: 路径为
data/train-* - test: 路径为
data/test-*
- train: 路径为
- data_files:



