YYYYYYibo/gshf_train_part_2_mini_1

Name: YYYYYYibo/gshf_train_part_2_mini_1
Creator: YYYYYYibo
Published: 2024-07-05 06:20:06
License: 暂无描述

Hugging Face2024-07-05 更新2024-07-06 收录

下载链接：

https://hf-mirror.com/datasets/YYYYYYibo/gshf_train_part_2_mini_1

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集主要用于存储对话数据，包含提示（prompt）、提示ID（prompt_id）、消息（messages）、选择的评分（score_chosen）、拒绝的评分（score_rejected）、参考响应（reference_response）、选择的内容（chosen）和拒绝的内容（rejected）等特征。数据集的训练部分包含2500个示例，总大小为22200354字节。

This dataset is primarily used to store dialogue data, including features such as prompt, prompt_id, messages, score_chosen, score_rejected, reference_response, chosen, and rejected. The training portion of the dataset contains 2500 examples, with a total size of 22200354 bytes.

提供机构：

YYYYYYibo

原始信息汇总

数据集概述

数据集信息

特征

prompt: 字符串类型
prompt_id: 字符串类型
messages: 列表类型，包含以下字段：
- content: 字符串类型
- role: 字符串类型
score_chosen: 浮点数类型
score_rejected: 浮点数类型
reference_response: 字符串类型
chosen: 列表类型，包含以下字段：
- content: 字符串类型
- role: 字符串类型
rejected: 列表类型，包含以下字段：
- content: 字符串类型
- role: 字符串类型

分割

train_prefs: 包含2500个样本，总字节数为22200354

大小

下载大小: 0字节
数据集大小: 22200354字节

配置

config_name: default
data_files:
- split: train_prefs
- path: data/train_prefs-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集