roy29fuku/sample-large
收藏Hugging Face2024-03-07 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/roy29fuku/sample-large
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是用于Hugging Face数据集创建教程的样本数据,数据来源于PMC OS Subset,包含了约40万篇论文的摘要。
该数据集是用于Hugging Face数据集创建教程的样本数据,数据来源于PMC OS Subset,包含了约40万篇论文的摘要。
提供机构:
roy29fuku
原始信息汇总
数据集概述
数据来源
- 数据集是从PMC OS Subset的
oa_comm_xml.PMC010xxxxxx.baseline.2023-12-18.tar.gz文件中提取的,该文件位于https://ftp.ncbi.nlm.nih.gov/pub/pmc/oa_bulk/oa_comm/xml/。
数据内容
- 数据集包含了约40万篇论文的摘要。
文件配置
- 数据文件配置如下:
- 配置名称:default
- 数据文件:
- 分割:train
- 路径:
data/*.parquet



