YYYYYYibo/gshf_train_part_3
收藏Hugging Face2024-07-05 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/YYYYYYibo/gshf_train_part_3
下载链接
链接失效反馈官方服务:
资源简介:
该数据集主要用于存储对话数据及其评分,包含prompt、prompt_id、messages、score_chosen、score_rejected、reference_response、chosen和rejected等特征。数据集的训练部分包含21,135个示例,总大小为192,666,046字节。
This dataset is primarily used for storing dialogue data and their ratings, including features such as prompt, prompt_id, messages, score_chosen, score_rejected, reference_response, chosen, and rejected. The training portion of the dataset contains 21,135 examples with a total size of 192,666,046 bytes.
提供机构:
YYYYYYibo
原始信息汇总
数据集概述
数据集信息
-
特征:
prompt: 字符串类型prompt_id: 字符串类型messages: 列表类型,包含以下子特征:content: 字符串类型role: 字符串类型
score_chosen: 浮点数类型score_rejected: 浮点数类型reference_response: 字符串类型chosen: 列表类型,包含以下子特征:content: 字符串类型role: 字符串类型
rejected: 列表类型,包含以下子特征:content: 字符串类型role: 字符串类型
-
分割:
train_prefs:- 字节数: 192,666,046
- 样本数: 21,135
-
下载大小: 104,574,818 字节
-
数据集大小: 192,666,046 字节
配置
- 配置名称:
default- 数据文件:
train_prefs:- 路径:
data/train_prefs-*
- 路径:
- 数据文件:



