全国科技项目数据集
收藏贵州省数据知识产权登记平台2025-11-14 更新2025-11-15 收录
下载链接:
https://gzdipp.gzsis.cn:12020/noticeDetail?id=1560&type=1
下载链接
链接失效反馈官方服务:
资源简介:
1、数据采集算法
(1)平台遍历算法:通过编写自动化脚本,遍历全国各相关科技项目发布平台,获取公开的科技项目信息及完成情况,确保数据来源的合法性、广泛性和全面性。
(2)特征提取算法:运用 TF-IDF 技术,对科技项目相关文本内容进行分析,提取项目名称、项目摘要、技术关键词、参与人员、项目金额等特征信息。
2、深度处理算法
采用 Bert 模型对原始项目数据库的内容进行深度处理,确认提取文本内容的有效性,最终生成科技项目数据集。
3、存储策略算法
根据不同的数据需求类型,设计动态存储策略算法。例如,对于按领域分类查询的需求,采用分层存储结构,将相同领域的项目数据集中存储;对于按时间序列分析的需求,则按照时间维度进行数据组织存储,以便快速定制加工和分析。
提供机构:
科力辰(贵州)科技有限公司
创建时间:
2025-11-12
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



