2018YFB1402604-计算机学科2000-2010年论文数据库
收藏国家基础学科公共科学数据中心2024-03-05 收录
下载链接:
https://www.nbsdc.cn/general/dataDetail?id=64ef8573bb16e0591d0258f8&type=1
下载链接
链接失效反馈官方服务:
资源简介:
“计算机学科2000-2010年论文数据集”采集自网络上已经公开的计算机学科论文(arXiv、IEEE、Elsevier、Springer等),通过网络爬虫抓取可合法获取的公开论文;从爬取到的公开论文数据中抽取论文的标题、作者、摘要、主题和引用列表等信息;通过去重和关键词匹配等策略筛选出有效论文。
提供机构:
华中科技大学
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集收录了2000年至2010年间计算机学科的公开论文,通过爬取arXiv、IEEE等平台并抽取标题、作者等元信息构建而成。数据经过去重和关键词匹配处理,总量为2.16GB,旨在提供该时期计算机学科论文的结构化信息。
以上内容由遇见数据集搜集并总结生成



