科技文献通用领域知识对象识别测试数据集
收藏国家基础学科公共科学数据中心2025-12-06 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=6931b018195d2658bc1e5f9b&type=1
下载链接
链接失效反馈官方服务:
资源简介:
科技文献通用领域知识对象识别测试数据主要面向科技文献通用领域知识挖掘研究的需求,包括科技文献通用篇章句子级知识对象识别测试数据集、通用短语级知识对象识别测试数据集。通用篇章句子级知识对象识别测试数据集包含科研论文中按功能划分的语步(包括研究背景句、研究目的句、研究方法句、研究结果句、研究结论句5类)、研究问题句、概念定义句、引用句、创新句等9类句子级知识对象。短语级知识对象识别测试数据集包含方法模型、数据资料、仪器设备、度量指标、软件系统、理论原理、地点、科学家、研究问题、概念词等10类短语级知识对象。科技文献通用领域知识对象识别测试数据集约6M,为计算社会科学、信息检索和人工智能等多个领域提供了关键的数据支撑,为推动科学研究的智能化进程中提供数据支撑。数据主要来源于开源的权威学术数据库和开放获取平台。采集范围涵盖生物医学、计算机科学、材料科学、数学、物理、化学、农业和天文学等多个学科领域,确保数据的跨领域代表性。采集方式包括批量下载与原始文献(PDF/XML格式)解析、利用数据库查询进行结构化过滤等方式。
提供机构:
中国科学院文献情报中心



