pinmax/arxiv_balanced_soft_labels
收藏Hugging Face2026-04-08 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/pinmax/arxiv_balanced_soft_labels
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: title
dtype: string
- name: abstract
dtype: string
- name: label
dtype:
class_label:
names:
'0': '0'
'1': '1'
'2': '2'
'3': '3'
'4': '4'
'5': '5'
'6': '6'
'7': '7'
- name: soft_labels
list: float64
splits:
- name: train
num_bytes: 171529660
num_examples: 139511
- name: test
num_bytes: 42882722
num_examples: 34878
download_size: 130032047
dataset_size: 214412382
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
---
数据集信息:
特征:
- 名称:标题(title),数据类型:字符串(string)
- 名称:摘要(abstract),数据类型:字符串(string)
- 名称:标签(label),数据类型:
类别标签(class_label):
取值映射:
'0': '0'
'1': '1'
'2': '2'
'3': '3'
'4': '4'
'5': '5'
'6': '6'
'7': '7'
- 名称:软标签(soft_labels),数据类型:64位浮点数(float64)列表
数据集划分:
- 划分名称:训练集(train),字节大小:171529660,样本数量:139511
- 划分名称:测试集(test),字节大小:42882722,样本数量:34878
下载大小:130032047
数据集总大小:214412382
配置项:
- 配置名称:默认配置(default)
数据文件:
- 划分:训练集(train),路径:data/train-*
- 划分:测试集(test),路径:data/test-*
提供机构:
pinmax



