five

Xalphinions/UltraFeedback_with_tie_armorm_1e-4

收藏
Hugging Face2024-07-22 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Xalphinions/UltraFeedback_with_tie_armorm_1e-4
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个特征,主要用于比较和评估不同文本内容的优劣。每个例子包含chosen和rejected两个主要部分,分别代表被选中和被拒绝的文本内容及其角色。此外,还包括评分、相对差异、提示信息和是否平局等辅助信息。数据集分为训练集和测试集,适用于机器学习和自然语言处理任务。

This dataset includes multiple features, primarily used for comparing and evaluating the quality of different text contents. Each example contains two main parts, chosen and rejected, representing the selected and rejected text contents and their roles, respectively. Additionally, it includes auxiliary information such as scores, relative differences, prompts, and whether it is a tie. The dataset is divided into training and test sets, suitable for machine learning and natural language processing tasks.
提供机构:
Xalphinions
原始信息汇总

数据集概述

数据集信息

特征

  • chosen:
    • content: 字符串类型
    • role: 字符串类型
  • rejected:
    • content: 字符串类型
    • role: 字符串类型
  • score_a: 浮点数类型
  • score_b: 浮点数类型
  • relative_diff: 浮点数类型
  • prompt: 字符串类型
  • tie: 整数类型

数据分割

  • train:
    • 字节数: 106907249
    • 样本数: 19313
  • test:
    • 字节数: 5606710
    • 样本数: 1000

数据大小

  • 下载大小: 60295772 字节
  • 数据集大小: 112513959 字节

配置

  • config_name: default
    • data_files:
      • train: data/train-*
      • test: data/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作