GitBag/llama3-ultrafeedback-armo
收藏Hugging Face2024-07-22 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/GitBag/llama3-ultrafeedback-armo
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个响应、提示、奖励分数、选择和拒绝等信息,主要用于训练和评估模型。数据集的训练部分包含58,573个样本,总大小为4,654,271,291字节。
This dataset includes multiple responses, prompts, reward scores, chosen and rejected responses, primarily used for training and evaluating models. The training portion of the dataset contains 58,573 samples with a total size of 4,654,271,291 bytes.
提供机构:
GitBag
原始信息汇总
数据集概述
数据集特征
- response_0: 字符串类型
- response_1: 字符串类型
- response_2: 字符串类型
- response_3: 字符串类型
- response_4: 字符串类型
- prompt_id: 字符串类型
- prompt: 字符串类型
- llama_prompt: 字符串类型
- llama_prompt_tokens: 整数序列
- response_0_reward: 浮点数类型
- response_1_reward: 浮点数类型
- response_2_reward: 浮点数类型
- response_3_reward: 浮点数类型
- response_4_reward: 浮点数类型
- chosen: 字符串类型
- chosen_reward: 浮点数类型
- llama_chosen: 字符串类型
- llama_chosen_tokens: 整数序列
- reject: 字符串类型
- reject_reward: 浮点数类型
- llama_reject: 字符串类型
- llama_reject_tokens: 整数序列
- chosen_logprob: 浮点数类型
- reject_logprob: 浮点数类型
数据集分割
- train_prefs:
- 字节数: 4654271291
- 样本数: 58573
数据集大小
- 下载大小: 740402203 字节
- 数据集大小: 4654271291 字节
配置
- config_name: default
- data_files:
- split: train_prefs
- path: data/train_prefs-*
- data_files:



