YYYYYYibo/gshf_vllm_1_part_2_mini_4

Name: YYYYYYibo/gshf_vllm_1_part_2_mini_4
Creator: YYYYYYibo
Published: 2024-07-04 13:32:49
License: 暂无描述

Hugging Face2024-07-04 更新2024-07-06 收录

下载链接：

https://hf-mirror.com/datasets/YYYYYYibo/gshf_vllm_1_part_2_mini_4

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含多个对话相关的特征，如提示（prompt）、提示ID（prompt_id）、选择的回复（chosen）、拒绝的回复（rejected）、消息列表（messages）等。每个特征都有其特定的数据类型，例如字符串或浮点数。数据集包含一个训练偏好（train_prefs）分割，包含2500个示例，总大小为25547784字节。数据集的下载大小为14012884字节。该数据集可能用于对话系统或自然语言处理任务中的模型训练和评估。

This dataset contains multiple features related to dialogues, such as prompt, prompt_id, chosen, rejected, messages, etc. Each feature has its specific data type, such as string or float. The dataset includes a training preference (train_prefs) split with 2500 examples and a total size of 25547784 bytes. The download size of the dataset is 14012884 bytes. This dataset is likely used for model training and evaluation in dialogue systems or natural language processing tasks.

提供机构：

YYYYYYibo

原始信息汇总

数据集概述

数据集信息

特征

prompt: 字符串类型
prompt_id: 字符串类型
chosen: 列表类型
- content: 字符串类型
- role: 字符串类型
rejected: 列表类型
- content: 字符串类型
- role: 字符串类型
messages: 列表类型
- content: 字符串类型
- role: 字符串类型
score_chosen: 浮点数类型
score_rejected: 浮点数类型
reference_response: 字符串类型
resp1: 字符串类型

数据分割

train_prefs:
- 字节数: 25547784
- 样本数: 2500

数据集大小

下载大小: 14012884 字节
数据集大小: 25547784 字节

配置

default:
- 数据文件:
  - 分割: train_prefs
  - 路径: data/train_prefs-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集