YYYYYYibo/gshf_vllm_1_part_2_mini_4
收藏Hugging Face2024-07-04 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/YYYYYYibo/gshf_vllm_1_part_2_mini_4
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个对话相关的特征,如提示(prompt)、提示ID(prompt_id)、选择的回复(chosen)、拒绝的回复(rejected)、消息列表(messages)等。每个特征都有其特定的数据类型,例如字符串或浮点数。数据集包含一个训练偏好(train_prefs)分割,包含2500个示例,总大小为25547784字节。数据集的下载大小为14012884字节。该数据集可能用于对话系统或自然语言处理任务中的模型训练和评估。
This dataset contains multiple features related to dialogues, such as prompt, prompt_id, chosen, rejected, messages, etc. Each feature has its specific data type, such as string or float. The dataset includes a training preference (train_prefs) split with 2500 examples and a total size of 25547784 bytes. The download size of the dataset is 14012884 bytes. This dataset is likely used for model training and evaluation in dialogue systems or natural language processing tasks.
提供机构:
YYYYYYibo
原始信息汇总
数据集概述
数据集信息
特征
- prompt: 字符串类型
- prompt_id: 字符串类型
- chosen: 列表类型
- content: 字符串类型
- role: 字符串类型
- rejected: 列表类型
- content: 字符串类型
- role: 字符串类型
- messages: 列表类型
- content: 字符串类型
- role: 字符串类型
- score_chosen: 浮点数类型
- score_rejected: 浮点数类型
- reference_response: 字符串类型
- resp1: 字符串类型
数据分割
- train_prefs:
- 字节数: 25547784
- 样本数: 2500
数据集大小
- 下载大小: 14012884 字节
- 数据集大小: 25547784 字节
配置
- default:
- 数据文件:
- 分割: train_prefs
- 路径: data/train_prefs-*
- 数据文件:



