ZhangShenao/gc_fine_posonly_ultrafeedback_nosys

Name: ZhangShenao/gc_fine_posonly_ultrafeedback_nosys
Creator: ZhangShenao
Published: 2024-07-15 18:16:30
License: 暂无描述

Hugging Face2024-07-15 更新2024-07-22 收录

下载链接：

https://hf-mirror.com/datasets/ZhangShenao/gc_fine_posonly_ultrafeedback_nosys

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含多个字段，主要用于记录和比较不同文本内容的选择和拒绝情况。字段包括提示（prompt）、提示ID（prompt_id）、选择内容（chosen）、拒绝内容（rejected）、消息列表（messages）以及相关的评分（overall_score_chosen, overall_score_rejected, fine_grain_score_chosen, fine_grain_score_rejected, avg_fine_score_chosen, avg_fine_score_rejected）。数据集分为训练集（train_prefs）和测试集（test_prefs），分别包含47553和2000个示例。

This dataset is primarily used for natural language processing tasks, containing multiple text and scoring-related features. The dataset is divided into training and test sets, with 47553 samples in the training set and 2000 samples in the test set.

提供机构：

ZhangShenao

原始信息汇总

数据集概述

数据集信息

特征

prompt: 类型为字符串。
prompt_id: 类型为字符串。
chosen: 包含以下子特征：
- content: 类型为字符串。
- role: 类型为字符串。
rejected: 包含以下子特征：
- content: 类型为字符串。
- role: 类型为字符串。
messages: 包含以下子特征：
- content: 类型为字符串。
- role: 类型为字符串。
overall_score_chosen: 类型为浮点数。
overall_score_rejected: 类型为浮点数。
fine_grain_score_chosen: 类型为浮点数序列。
fine_grain_score_rejected: 类型为浮点数序列。
avg_fine_score_chosen: 类型为浮点数。
avg_fine_score_rejected: 类型为浮点数。

数据分割

train_prefs:
- 字节数: 356853487
- 样本数: 47553
test_prefs:
- 字节数: 13675818
- 样本数: 2000

数据集大小

下载大小: 189238045 字节
数据集总大小: 370529305 字节

配置

config_name: default
- data_files:
  - train_prefs: 路径为 data/train_prefs-*
  - test_prefs: 路径为 data/test_prefs-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集