ARXIV data from 24,000+ papers来自24,000余篇论文的ARXIV数据
收藏阿里云天池2026-06-09 更新2024-03-07 收录
下载链接:
https://tianchi.aliyun.com/dataset/93754
下载链接
链接失效反馈官方服务:
资源简介:
收集31000多个纸质元数据。该数据包含与1992年至2018年2月之间发布的ML,CL,NER,AI和CV相关的所有论文。
This dataset contains metadata for more than 31,000 academic papers. All papers included are related to Machine Learning (ML), Computational Linguistics (CL), Named Entity Recognition (NER), Artificial Intelligence (AI), and Computer Vision (CV), and were published between 1992 and February 2018.
提供机构:
阿里云天池
创建时间:
2021-03-10
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集收集了超过31,000篇论文的元数据,涵盖机器学习、计算语言学、命名实体识别、人工智能和计算机视觉等领域。这些论文发表于1992年至2018年2月之间,数据以json文件形式提供。
以上内容由遇见数据集搜集并总结生成



