YYYYYYibo/gshf_vllm_1_part_2
收藏Hugging Face2024-07-05 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/YYYYYYibo/gshf_vllm_1_part_2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含用于对话或文本生成任务的数据,主要特征包括提示(prompt)、提示ID(prompt_id)、选择的响应(chosen)、拒绝的响应(rejected)、消息内容(messages)以及相关的评分(score_chosen和score_rejected)。数据集还包含参考响应(reference_response)和另一个响应(resp1)。数据集的分割为train_prefs,包含20,000个示例,总大小为206,416,941字节。
This dataset contains data for dialogue or text generation tasks, with main features including prompt, prompt_id, chosen response, rejected response, messages, and related scores (score_chosen and score_rejected). The dataset also includes a reference response (reference_response) and another response (resp1). The dataset is split into train_prefs, containing 20,000 examples with a total size of 206,416,941 bytes.
提供机构:
YYYYYYibo
原始信息汇总
数据集概述
数据集信息
-
特征:
prompt: 字符串类型prompt_id: 字符串类型chosen: 列表类型,包含以下子特征:content: 字符串类型role: 字符串类型
rejected: 列表类型,包含以下子特征:content: 字符串类型role: 字符串类型
messages: 列表类型,包含以下子特征:content: 字符串类型role: 字符串类型
score_chosen: 浮点数类型score_rejected: 浮点数类型reference_response: 字符串类型resp1: 字符串类型
-
分割:
train_prefs:- 字节数: 206416941
- 样本数: 20000
-
下载大小: 0
-
数据集大小: 206416941
配置
- 配置名称:
default- 数据文件:
train_prefs:data/train_prefs-*
- 数据文件:



