YYYYYYibo/gshf_train_part_3

Name: YYYYYYibo/gshf_train_part_3
Creator: YYYYYYibo
Published: 2024-07-05 07:37:41
License: 暂无描述

Hugging Face2024-07-05 更新2024-07-06 收录

下载链接：

https://hf-mirror.com/datasets/YYYYYYibo/gshf_train_part_3

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集主要用于存储对话数据及其评分，包含prompt、prompt_id、messages、score_chosen、score_rejected、reference_response、chosen和rejected等特征。数据集的训练部分包含21,135个示例，总大小为192,666,046字节。

This dataset is primarily used for storing dialogue data and their ratings, including features such as prompt, prompt_id, messages, score_chosen, score_rejected, reference_response, chosen, and rejected. The training portion of the dataset contains 21,135 examples with a total size of 192,666,046 bytes.

提供机构：

YYYYYYibo

原始信息汇总

数据集概述

数据集信息

特征:
- prompt: 字符串类型
- prompt_id: 字符串类型
- messages: 列表类型，包含以下子特征:
  - content: 字符串类型
  - role: 字符串类型
- score_chosen: 浮点数类型
- score_rejected: 浮点数类型
- reference_response: 字符串类型
- chosen: 列表类型，包含以下子特征:
  - content: 字符串类型
  - role: 字符串类型
- rejected: 列表类型，包含以下子特征:
  - content: 字符串类型
  - role: 字符串类型
分割:
- train_prefs:
  - 字节数: 192,666,046
  - 样本数: 21,135
下载大小: 104,574,818 字节
数据集大小: 192,666,046 字节

配置

配置名称: default
- 数据文件:
  - train_prefs:
    - 路径: data/train_prefs-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集