five

Xalphinions/UltraFeedback_with_tie_strict

收藏
Hugging Face2024-07-11 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Xalphinions/UltraFeedback_with_tie_strict
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含训练集和测试集,主要用于比较和选择模型输出。每个样本包含chosen和rejected两个选项,每个选项有content和role两个字段,分别表示内容和角色。此外,每个样本还包含一个prompt字段和一个tie字段,prompt用于提示模型生成内容,tie用于标识是否两个选项质量相当。训练集包含64085个样本,测试集包含1000个样本。

This dataset includes training and test sets, primarily used for comparing and selecting model outputs. Each sample contains chosen and rejected options, each with content and role fields, representing the content and role respectively. Additionally, each sample includes a prompt field and a tie field, where prompt is used to prompt the model to generate content, and tie indicates whether the quality of the two options is comparable. The training set contains 64,085 samples, and the test set contains 1,000 samples.
提供机构:
Xalphinions
原始信息汇总

数据集概述

数据集信息

特征

  • chosen:
    • content: 数据类型为 string
    • role: 数据类型为 string
  • rejected:
    • content: 数据类型为 string
    • role: 数据类型为 string
  • prompt: 数据类型为 string
  • tie: 数据类型为 int64

数据分割

  • train:
    • 字节数: 380244988
    • 样本数: 64085
  • test:
    • 字节数: 5880964
    • 样本数: 1000

数据大小

  • 下载大小: 120535160 字节
  • 数据集大小: 386125952 字节

配置

  • config_name: default
    • data_files:
      • train: 路径为 data/train-*
      • test: 路径为 data/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作