YYYYYYibo/gshf_vllm_1_part_2

Name: YYYYYYibo/gshf_vllm_1_part_2
Creator: YYYYYYibo
Published: 2024-07-05 05:45:54
License: 暂无描述

Hugging Face2024-07-05 更新2024-07-06 收录

下载链接：

https://hf-mirror.com/datasets/YYYYYYibo/gshf_vllm_1_part_2

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含用于对话或文本生成任务的数据，主要特征包括提示（prompt）、提示ID（prompt_id）、选择的响应（chosen）、拒绝的响应（rejected）、消息内容（messages）以及相关的评分（score_chosen和score_rejected）。数据集还包含参考响应（reference_response）和另一个响应（resp1）。数据集的分割为train_prefs，包含20,000个示例，总大小为206,416,941字节。

This dataset contains data for dialogue or text generation tasks, with main features including prompt, prompt_id, chosen response, rejected response, messages, and related scores (score_chosen and score_rejected). The dataset also includes a reference response (reference_response) and another response (resp1). The dataset is split into train_prefs, containing 20,000 examples with a total size of 206,416,941 bytes.

提供机构：

YYYYYYibo

原始信息汇总

数据集概述

数据集信息

特征:
- prompt: 字符串类型
- prompt_id: 字符串类型
- chosen: 列表类型，包含以下子特征:
  - content: 字符串类型
  - role: 字符串类型
- rejected: 列表类型，包含以下子特征:
  - content: 字符串类型
  - role: 字符串类型
- messages: 列表类型，包含以下子特征:
  - content: 字符串类型
  - role: 字符串类型
- score_chosen: 浮点数类型
- score_rejected: 浮点数类型
- reference_response: 字符串类型
- resp1: 字符串类型
分割:
- train_prefs:
  - 字节数: 206416941
  - 样本数: 20000
下载大小: 0
数据集大小: 206416941

配置

配置名称: default
- 数据文件:
  - train_prefs: data/train_prefs-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集