flydust/ultrafeedback-labeled
收藏Hugging Face2024-07-09 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/flydust/ultrafeedback-labeled
下载链接
链接失效反馈官方服务:
资源简介:
这是一个标记版本的数据集,名为UltraFeedback。该数据集使用Llama-3-8B Instruct模型来标记指令。数据集包含多个特征,如prompt_id、prompt、chosen、rejected和task_category。数据集分为训练集和测试集,训练集包含59876个样本,测试集包含1961个样本。
This is the labeled version of the UltraFeedback dataset. We use Llama-3-8B Instruct to label instructions. The dataset contains multiple features such as prompt_id, prompt, chosen, rejected, and task_category. The dataset is divided into a training set and a test set, with the training set containing 59,876 samples and the test set containing 1,961 samples.
提供机构:
flydust
原始信息汇总
数据集概述
数据集信息
特征
- prompt_id: 字符串类型
- prompt: 字符串类型
- chosen: 列表类型
- content: 字符串类型
- role: 字符串类型
- rejected: 列表类型
- content: 字符串类型
- role: 字符串类型
- task_category: 字符串类型
数据分割
- train:
- 字节数: 344806152
- 样本数: 59876
- test:
- 字节数: 11084209
- 样本数: 1961
数据集大小
- 下载大小: 190274478 字节
- 数据集大小: 355890361 字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- split: test
- path: data/test-*
- split: train
- data_files:



