基于深度关联分析的集成演化机制设计数据集
收藏国家基础学科公共科学数据中心2026-01-30 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=67fb6456195d265448044996&type=1
下载链接
链接失效反馈官方服务:
资源简介:
针对产品生态中的数据集成演化场景,揭示数据空间内的数据关联性与演化规律。数据采集自GitHub的1496个流行开源项目,利用GumTree匹配算法对数据变更进行细粒度比对,提取数据协同演化变更实例,揭示数据间的潜在关联性与演化模式,最终获得108,360个有效协同演化样本实例。为确保时间依赖性与演化一致性,按数据演化提交时间排序,将前80%的提交作为训练集,用于捕获数据协同演化的深度关联性,其余20%随机分配至验证集和测试集,分别包含86,609、10,805和10,946个实例。同时,数据集包含了指标对应的1篇专利、2个软著和1份第三方测试报告,数据量375MB。
提供机构:
重庆大学



