keerthanapacific/sample4
收藏Hugging Face2024-07-19 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/keerthanapacific/sample4
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含医学文献的相关信息,每篇文献具有唯一的pmcid标识符、标题、摘要、全文内容以及文件路径。数据集分为一个训练集,包含5091个样本,总大小为133418001字节。下载大小为68131980字节。数据集的配置文件名为default,数据文件路径为data/train-*。
This dataset contains information related to medical literature, with each entry having a unique pmcid identifier, title, abstract, full text content, and file path. The dataset is divided into a training set containing 5091 samples, with a total size of 133418001 bytes. The download size is 68131980 bytes. The configuration file for the dataset is named default, and the data file path is data/train-*.
提供机构:
keerthanapacific
原始信息汇总
数据集概述
数据集特征
- pmcid: 字符串类型
- title: 字符串类型
- abstract: 字符串类型
- fulltext: 字符串类型
- file_path: 字符串类型
数据集分割
- train:
- 字节数: 133418001
- 样本数: 5091
数据集大小
- 下载大小: 68131980 字节
- 数据集大小: 133418001 字节
配置
- default:
- 数据文件路径:
data/train-*
- 数据文件路径:



