alvarobartt/ultrafeedback-multi-binarized-quality-preferences-cleaned

Name: alvarobartt/ultrafeedback-multi-binarized-quality-preferences-cleaned
Creator: alvarobartt
Published: 2023-12-20 10:14:40
License: 暂无描述

Hugging Face2023-12-20 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/alvarobartt/ultrafeedback-multi-binarized-quality-preferences-cleaned

下载链接

链接失效反馈

官方服务：

资源简介：

数据集包含多个特征，如source、prompt、chosen和rejected等，每个特征下有不同的字段和数据类型。数据集分为训练集和测试集，训练集包含146883个示例，测试集包含7780个示例。数据集的总大小为724021891.6044441字节，下载大小为206672367字节。

提供机构：

alvarobartt

原始信息汇总

数据集概述

数据特征

source: 数据来源，类型为字符串。
prompt: 提示信息，类型为字符串。
chosen:
- content: 内容，类型为字符串。
- role: 角色，类型为字符串。
chosen-rating: 评分，类型为浮点数（float64）。
chosen-model: 模型，类型为字符串。
rejected:
- content: 内容，类型为字符串。
- role: 角色，类型为字符串。
rejected-rating: 评分，类型为浮点数（float64）。
rejected-model: 模型，类型为字符串。

数据分割

train:
- 字节数: 687874454.227975
- 样本数: 146883
test:
- 字节数: 36147437.3764691
- 样本数: 7780

数据大小

下载大小: 206672367 字节
数据集大小: 724021891.6044441 字节

配置

config_name: default
- data_files:
  - train: 路径为 data/train-*
  - test: 路径为 data/test-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集