five

GitBag/llama3-ultrafeedback-armo

收藏
Hugging Face2024-07-22 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/GitBag/llama3-ultrafeedback-armo
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个响应、提示、奖励分数、选择和拒绝等信息,主要用于训练和评估模型。数据集的训练部分包含58,573个样本,总大小为4,654,271,291字节。

This dataset includes multiple responses, prompts, reward scores, chosen and rejected responses, primarily used for training and evaluating models. The training portion of the dataset contains 58,573 samples with a total size of 4,654,271,291 bytes.
提供机构:
GitBag
原始信息汇总

数据集概述

数据集特征

  • response_0: 字符串类型
  • response_1: 字符串类型
  • response_2: 字符串类型
  • response_3: 字符串类型
  • response_4: 字符串类型
  • prompt_id: 字符串类型
  • prompt: 字符串类型
  • llama_prompt: 字符串类型
  • llama_prompt_tokens: 整数序列
  • response_0_reward: 浮点数类型
  • response_1_reward: 浮点数类型
  • response_2_reward: 浮点数类型
  • response_3_reward: 浮点数类型
  • response_4_reward: 浮点数类型
  • chosen: 字符串类型
  • chosen_reward: 浮点数类型
  • llama_chosen: 字符串类型
  • llama_chosen_tokens: 整数序列
  • reject: 字符串类型
  • reject_reward: 浮点数类型
  • llama_reject: 字符串类型
  • llama_reject_tokens: 整数序列
  • chosen_logprob: 浮点数类型
  • reject_logprob: 浮点数类型

数据集分割

  • train_prefs:
    • 字节数: 4654271291
    • 样本数: 58573

数据集大小

  • 下载大小: 740402203 字节
  • 数据集大小: 4654271291 字节

配置

  • config_name: default
    • data_files:
      • split: train_prefs
      • path: data/train_prefs-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作