YYYYYYibo/gshf_train_part_2_mini_1
收藏Hugging Face2024-07-05 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/YYYYYYibo/gshf_train_part_2_mini_1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集主要用于存储对话数据,包含提示(prompt)、提示ID(prompt_id)、消息(messages)、选择的评分(score_chosen)、拒绝的评分(score_rejected)、参考响应(reference_response)、选择的内容(chosen)和拒绝的内容(rejected)等特征。数据集的训练部分包含2500个示例,总大小为22200354字节。
This dataset is primarily used to store dialogue data, including features such as prompt, prompt_id, messages, score_chosen, score_rejected, reference_response, chosen, and rejected. The training portion of the dataset contains 2500 examples, with a total size of 22200354 bytes.
提供机构:
YYYYYYibo
原始信息汇总
数据集概述
数据集信息
特征
- prompt: 字符串类型
- prompt_id: 字符串类型
- messages: 列表类型,包含以下字段:
- content: 字符串类型
- role: 字符串类型
- score_chosen: 浮点数类型
- score_rejected: 浮点数类型
- reference_response: 字符串类型
- chosen: 列表类型,包含以下字段:
- content: 字符串类型
- role: 字符串类型
- rejected: 列表类型,包含以下字段:
- content: 字符串类型
- role: 字符串类型
分割
- train_prefs: 包含2500个样本,总字节数为22200354
大小
- 下载大小: 0字节
- 数据集大小: 22200354字节
配置
- config_name: default
- data_files:
- split: train_prefs
- path: data/train_prefs-*



