ZhangShenao/gc_fine_posonly_ultrafeedback_nosys
收藏Hugging Face2024-07-15 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/ZhangShenao/gc_fine_posonly_ultrafeedback_nosys
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个字段,主要用于记录和比较不同文本内容的选择和拒绝情况。字段包括提示(prompt)、提示ID(prompt_id)、选择内容(chosen)、拒绝内容(rejected)、消息列表(messages)以及相关的评分(overall_score_chosen, overall_score_rejected, fine_grain_score_chosen, fine_grain_score_rejected, avg_fine_score_chosen, avg_fine_score_rejected)。数据集分为训练集(train_prefs)和测试集(test_prefs),分别包含47553和2000个示例。
This dataset is primarily used for natural language processing tasks, containing multiple text and scoring-related features. The dataset is divided into training and test sets, with 47553 samples in the training set and 2000 samples in the test set.
提供机构:
ZhangShenao
原始信息汇总
数据集概述
数据集信息
特征
- prompt: 类型为字符串。
- prompt_id: 类型为字符串。
- chosen: 包含以下子特征:
- content: 类型为字符串。
- role: 类型为字符串。
- rejected: 包含以下子特征:
- content: 类型为字符串。
- role: 类型为字符串。
- messages: 包含以下子特征:
- content: 类型为字符串。
- role: 类型为字符串。
- overall_score_chosen: 类型为浮点数。
- overall_score_rejected: 类型为浮点数。
- fine_grain_score_chosen: 类型为浮点数序列。
- fine_grain_score_rejected: 类型为浮点数序列。
- avg_fine_score_chosen: 类型为浮点数。
- avg_fine_score_rejected: 类型为浮点数。
数据分割
- train_prefs:
- 字节数: 356853487
- 样本数: 47553
- test_prefs:
- 字节数: 13675818
- 样本数: 2000
数据集大小
- 下载大小: 189238045 字节
- 数据集总大小: 370529305 字节
配置
- config_name: default
- data_files:
- train_prefs: 路径为
data/train_prefs-* - test_prefs: 路径为
data/test_prefs-*
- train_prefs: 路径为
- data_files:



