five

全国科技成果数据集

收藏
贵州省数据知识产权登记平台2025-11-26 更新2025-11-27 收录
下载链接:
https://gzdipp.gzsis.cn:12020/noticeDetail?id=1675&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
1、数据采集算法 (1)多源汇聚算法:通过合法的自动化程序脚本,并行遍历各级科技管理部门、知识产权机构、学术数据库及项目承担单位的公开数据平台,实现科技成果数据的广泛与实时采集。 (2)实体识别算法:运用自然语言处理技术,从非结构化的文本中自动识别并标准化抽取机构、人员、技术关键词、资助项目编号等核心实体信息。 (3)关联映射算法:利用项目编号、机构名称、人员等实体作为关联键,将离散的论文、专利、技术报告等成果与对应的科技项目、承担机构进行精准关联,构建初始的成果关系网络。 2、深度处理算法 采用知识图谱与智能分析算法对初始数据进行深度处理。通过图计算模型,深度挖掘成果、机构、人员之间的复杂网络关系,量化其关联强度;同时,利用机器学习模型对成果的技术创新性、成熟度与影响力进行自动评估与打标,形成富含深度洞察的科技成果知识图谱。 3、存储策略算法 设计多模态自适应存储算法。根据不同的应用场景,采用混合存储架构。例如,为支持高效的关联查询和路径发现,将高度关联的数据组织成图结构进行存储;为满足大规模统计分析与趋势预测需求,则采用数据仓库技术,按时间、领域、地域等多个维度构建数据立方体。
提供机构:
科力辰(贵州)科技有限公司
创建时间:
2025-11-24
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
全国科技成果数据集是一个大规模数据集,包含610万条科技成果记录,每日更新,来源于公开收集。它汇总了科研论文、专利和技术成果等数据,支持科研机构、企业、政府部门和投资方进行数据分析、技术挖掘和政策制定,并通过先进的算法和知识图谱技术实现高效处理和存储。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务