five

ArXiV Archive

收藏
DataONE2020-06-24 更新2025-06-21 收录
下载链接:
https://search.dataone.org/view/sha256:56185633985138576e52a3a1c6587946df3c3b57034fa18da6db60a32f4086d8
下载链接
链接失效反馈
官方服务:
资源简介:
This is a full archive of metadata about papers on arxiv.org from 1993-2018, including abstracts. Data is tidy and packed in TSV files, in two different collections of the total dataset: per year (all categories) and per primary category (all years). This archive also includes Jupyter notebooks for unpacking and analyzing it in python. See the README.md file and https://github.com/staeiou/arxiv_archive for more information.

本数据集收录了1993年至2018年间arxiv.org平台上所有学术论文的完整元数据,涵盖论文摘要。数据格式规整规范,以TSV(制表符分隔值文件,Tab-Separated Values)文件封装。总数据集包含两类存储形式:按年度分组(覆盖全学科类目)与按主要学科类目分组(覆盖全时段)。本档案还附带适用于Python环境的解包与分析工具——Jupyter笔记本(Jupyter Notebook)。如需了解更多详情,请参阅README.md文件及项目仓库https://github.com/staeiou/arxiv_archive。
创建时间:
2025-06-14
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作