LA1512/pubmed-train-20K
收藏Hugging Face2024-05-21 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/LA1512/pubmed-train-20K
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含三个主要特征:文章(article)、摘要(abstract)和章节名称(section_names)。数据集分为一个训练集(train),包含20,000个样本,总大小为385,094,328.64字节。下载大小为179,362,690字节。数据集的配置为默认配置,数据文件路径为data/train-*。
该数据集包含三个主要特征:文章(article)、摘要(abstract)和章节名称(section_names)。数据集分为一个训练集(train),包含20,000个样本,总大小为385,094,328.64字节。下载大小为179,362,690字节。数据集的配置为默认配置,数据文件路径为data/train-*。
提供机构:
LA1512
原始信息汇总
数据集概述
数据集特征
- article:数据类型为字符串。
- abstract:数据类型为字符串。
- section_names:数据类型为字符串。
数据集分割
- train:包含20000个样本,数据大小为385094328.64362794字节。
数据集大小
- 下载大小:179362690字节。
- 数据集总大小:385094328.64362794字节。
配置
- default:训练数据文件路径为
data/train-*。



