five

YYYYYYibo/gshf_vllm_1_part_2_mini_4

收藏
Hugging Face2024-07-04 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/YYYYYYibo/gshf_vllm_1_part_2_mini_4
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个对话相关的特征,如提示(prompt)、提示ID(prompt_id)、选择的回复(chosen)、拒绝的回复(rejected)、消息列表(messages)等。每个特征都有其特定的数据类型,例如字符串或浮点数。数据集包含一个训练偏好(train_prefs)分割,包含2500个示例,总大小为25547784字节。数据集的下载大小为14012884字节。该数据集可能用于对话系统或自然语言处理任务中的模型训练和评估。

This dataset contains multiple features related to dialogues, such as prompt, prompt_id, chosen, rejected, messages, etc. Each feature has its specific data type, such as string or float. The dataset includes a training preference (train_prefs) split with 2500 examples and a total size of 25547784 bytes. The download size of the dataset is 14012884 bytes. This dataset is likely used for model training and evaluation in dialogue systems or natural language processing tasks.
提供机构:
YYYYYYibo
原始信息汇总

数据集概述

数据集信息

特征

  • prompt: 字符串类型
  • prompt_id: 字符串类型
  • chosen: 列表类型
    • content: 字符串类型
    • role: 字符串类型
  • rejected: 列表类型
    • content: 字符串类型
    • role: 字符串类型
  • messages: 列表类型
    • content: 字符串类型
    • role: 字符串类型
  • score_chosen: 浮点数类型
  • score_rejected: 浮点数类型
  • reference_response: 字符串类型
  • resp1: 字符串类型

数据分割

  • train_prefs:
    • 字节数: 25547784
    • 样本数: 2500

数据集大小

  • 下载大小: 14012884 字节
  • 数据集大小: 25547784 字节

配置

  • default:
    • 数据文件:
      • 分割: train_prefs
      • 路径: data/train_prefs-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作