five

YYYYYYibo/ultrafeedback_binarized_ave_pi_train_part_3_mini_3

收藏
Hugging Face2024-06-17 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/YYYYYYibo/ultrafeedback_binarized_ave_pi_train_part_3_mini_3
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为ultrafeedback_binarized_ave_pi_train_part_3_mini_3,包含多个文本和角色相关的特征,如prompt、prompt_id、messages、score_chosen、score_rejected、reference_response、chosen和rejected。数据集主要用于训练,包含5286个例子,总大小为42249924字节。

The dataset named ultrafeedback_binarized_ave_pi_train_part_3_mini_3 includes multiple features related to text and roles, such as prompt, prompt_id, messages, score_chosen, score_rejected, reference_response, chosen, and rejected. It is primarily used for training, containing 5286 examples with a total size of 42249924 bytes.
提供机构:
YYYYYYibo
原始信息汇总

数据集概述

数据集名称

ultrafeedback_binarized_ave_pi_train_part_3_mini_3

数据集结构

特征字段

  • prompt: 类型为字符串 (string)
  • prompt_id: 类型为字符串 (string)
  • messages: 列表类型,包含以下字段:
    • content: 类型为字符串 (string)
    • role: 类型为字符串 (string)
  • score_chosen: 类型为浮点数 (float64)
  • score_rejected: 类型为浮点数 (float64)
  • reference_response: 类型为字符串 (string)
  • chosen: 列表类型,包含以下字段:
    • content: 类型为字符串 (string)
    • role: 类型为字符串 (string)
  • rejected: 列表类型,包含以下字段:
    • content: 类型为字符串 (string)
    • role: 类型为字符串 (string)

数据分割

  • train_prefs: 包含5286个样本,总字节数为42249924

数据集大小

  • 下载大小: 22986930字节
  • 数据集大小: 42249924字节

配置

  • config_name: default
    • data_files:
      • split: train_prefs
      • path: data/train_prefs-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作