YYYYYYibo/ultrafeedback_binarized_simple_online_vllm_part_1_mini_1

Name: YYYYYYibo/ultrafeedback_binarized_simple_online_vllm_part_1_mini_1
Creator: YYYYYYibo
Published: 2024-05-19 15:14:56
License: 暂无描述

Hugging Face2024-05-19 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/YYYYYYibo/ultrafeedback_binarized_simple_online_vllm_part_1_mini_1

下载链接

链接失效反馈

官方服务：

资源简介：

数据集包含多个特征，如prompt（提示）、prompt_id（提示ID）、chosen（选定内容）和rejected（拒绝内容），每个特征都详细定义了其数据类型和结构。此外，数据集还包含评分和参考响应等特征，用于评估和比较文本内容。数据集被分割为训练集，大小为51672083字节，包含5000个示例。

--- 数据集信息：特征： - 名称：提示词（prompt）数据类型：字符串 - 名称：提示词ID（prompt_id）数据类型：字符串 - 名称：优选回复（chosen）类型：列表 - 子项名称：内容（content）数据类型：字符串 - 子项名称：角色（role）数据类型：字符串 - 名称：拒选回复（rejected）类型：列表 - 子项名称：内容（content）数据类型：字符串 - 子项名称：角色（role）数据类型：字符串 - 名称：对话消息（messages）类型：列表 - 子项名称：内容（content）数据类型：字符串 - 子项名称：角色（role）数据类型：字符串 - 名称：优选回复得分（score_chosen）数据类型：64位浮点数（float64） - 名称：拒选回复得分（score_rejected）数据类型：64位浮点数（float64） - 名称：参考回复（reference_response）数据类型：字符串 - 名称：resp0 数据类型：字符串 - 名称：resp1 数据类型：字符串数据集划分： - 划分名称：train_prefs 占用字节数：51672083 样本数量：5000 下载大小：28120430 数据集总大小：51672083 数据集配置： - 配置名称：默认（default）数据文件： - 划分：train_prefs 文件路径：data/train_prefs-* --- # 「ultrafeedback_binarized_simple_online_vllm_part_1_mini_1」数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

提供机构：

YYYYYYibo

原始信息汇总

数据集概述

数据集名称

名称: ultrafeedback_binarized_simple_online_vllm_part_1_mini_1

数据集特征

prompt: 字符串类型
prompt_id: 字符串类型
chosen: 列表类型，包含以下子特征：
- content: 字符串类型
- role: 字符串类型
rejected: 列表类型，包含以下子特征：
- content: 字符串类型
- role: 字符串类型
messages: 列表类型，包含以下子特征：
- content: 字符串类型
- role: 字符串类型
score_chosen: 浮点数类型（float64）
score_rejected: 浮点数类型（float64）
reference_response: 字符串类型
resp0: 字符串类型
resp1: 字符串类型

数据集分割

train_prefs:
- num_bytes: 51672083
- num_examples: 5000

数据集大小

download_size: 28120430
dataset_size: 51672083

配置

config_name: default
data_files:
- split: train_prefs
- path: data/train_prefs-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集