five

YYYYYYibo/ultrafeedback_binarized_imp_sam_minpi_2_part_2

收藏
Hugging Face2024-07-10 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/YYYYYYibo/ultrafeedback_binarized_imp_sam_minpi_2_part_2
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集主要用于对话或文本生成任务,包含输入提示(prompt)、选择的响应(chosen)、拒绝的响应(rejected)、消息列表(messages)等字段。数据集还包含多个评分和对数概率字段,可能用于模型训练或评估。训练集部分包含19100个样本。

This dataset is primarily used for dialogue or text generation tasks, containing fields such as input prompts (prompt), chosen responses (chosen), rejected responses (rejected), and message lists (messages). The dataset also includes multiple scoring and log probability fields, likely used for model training or evaluation. The training set portion contains 19,100 samples.
提供机构:
YYYYYYibo
原始信息汇总

数据集概述

数据集信息

特征

  • prompt: 字符串类型
  • prompt_id: 字符串类型
  • chosen: 列表类型
    • content: 字符串类型
    • role: 字符串类型
  • rejected: 列表类型
    • content: 字符串类型
    • role: 字符串类型
  • messages: 列表类型
    • content: 字符串类型
    • role: 字符串类型
  • score_chosen: 浮点数类型 (float64)
  • score_rejected: 浮点数类型 (float64)
  • reference_response: 字符串类型
  • resp0: 字符串类型
  • resp1: 字符串类型
  • resp2: 字符串类型
  • resp3: 字符串类型
  • logpi0: 浮点数类型 (float32)
  • logpi1: 浮点数类型 (float32)
  • logpi2: 浮点数类型 (float32)
  • logpi3: 浮点数类型 (float32)
  • logpiref0: 浮点数类型 (float32)
  • logpiref1: 浮点数类型 (float32)
  • logpiref2: 浮点数类型 (float32)
  • logpiref3: 浮点数类型 (float32)

数据分割

  • train_prefs:
    • num_bytes: 286782477
    • num_examples: 19100

数据集大小

  • download_size: 155780214
  • dataset_size: 286782477

配置

  • config_name: default
    • data_files:
      • split: train_prefs
      • path: data/train_prefs-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作