GitBag/llama3-ultrafeedback
收藏Hugging Face2024-07-20 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/GitBag/llama3-ultrafeedback
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征字段,如prompt、prompt_id、chosen、rejected、messages等,用于存储不同类型的文本数据。数据集包含一个名为train_prefs的分割,包含61135个示例,总大小为991118488字节。
This dataset contains multiple feature fields such as prompt, prompt_id, chosen, rejected, messages, etc., used to store different types of text data. The dataset includes a split named train_prefs, containing 61,135 examples with a total size of 991,118,488 bytes.
提供机构:
GitBag
原始信息汇总
数据集概述
数据集信息
特征
- prompt: 字符串类型
- prompt_id: 字符串类型
- chosen: 列表类型
- content: 字符串类型
- role: 字符串类型
- rejected: 列表类型
- content: 字符串类型
- role: 字符串类型
- messages: 列表类型
- content: 字符串类型
- role: 字符串类型
- score_chosen: 浮点数类型
- score_rejected: 浮点数类型
- processed_prompt: 字符串类型
- response_0: 字符串类型
- response_1: 字符串类型
- response_2: 字符串类型
- response_3: 字符串类型
- response_4: 字符串类型
数据分割
- train_prefs:
- 字节数: 991118488
- 样本数: 61135
数据集大小
- 下载大小: 537304451 字节
- 数据集大小: 991118488 字节
配置
- config_name: default
- data_files:
- split: train_prefs
- path: data/train_prefs-*
- data_files:



