LA1512/train_pubmed_ORC_1024_20K
收藏Hugging Face2024-06-12 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/LA1512/train_pubmed_ORC_1024_20K
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: article
dtype: string
- name: abstract
dtype: string
- name: section_names
dtype: string
- name: article_CS
dtype: string
- name: ext_target
sequence: int64
splits:
- name: train
num_bytes: 863887862
num_examples: 20000
download_size: 367214044
dataset_size: 863887862
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
提供机构:
LA1512
原始信息汇总
数据集概述
数据集信息
特征
- article: 文章内容,数据类型为字符串。
- abstract: 摘要内容,数据类型为字符串。
- section_names: 章节名称,数据类型为字符串。
- article_CS: 文章的计算机科学相关内容,数据类型为字符串。
- ext_target: 外部目标,数据类型为整数序列。
数据分割
- train: 训练集,包含20000个样本,总字节数为863887862。
数据集大小
- 下载大小: 367214044字节
- 数据集总大小: 863887862字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:



