数字政府建设类原创精品报告、白皮书敏感词脱敏数据
收藏浙江省数据知识产权登记平台2024-08-30 更新2024-08-31 收录
下载链接:
https://www.zjip.org.cn/home/announce/trends/56208
下载链接
链接失效反馈官方服务:
资源简介:
数字政府建设类原创精品报告、白皮书敏感词脱敏数据在数字政府建设领域有着广泛的应用。可为政府决策提供科学依据,减少决策失误,提高政策效果的可预测性。为政府提供数字化规划和实施项目的经验,推动政府的数字化转型。通过数字政府建设类原创精品报告、白皮书敏感词脱敏数据的深度应用,不仅提升了政府服务能力,也为社会经济的高质量发展提供了有力支撑,推动数据资源的整合与共享,实现数据驱动的可持续发展。为了保护这些数据不被未授权人员访问,需要对敏感信息进行脱敏处理,从而保护公司数据安全。数据主要从智慧中国年会官网、国脉互联公众号及公司官网的历年报告、白皮书等进行采集录入。按照预设规则建立敏感词库,对敏感词库中的词语根据所属数据字段进行分类,主要分报告名称类、报告描述类、附件地址类以及内容类,确定敏感词库中每个词语所属的敏感数据类型。导入原始数据集,在敏感数据识别模型使用KNN算法将原始数据中的数据与敏感词库中的词语进行检索比对,在检索到该词语时,判断该词语是否是敏感数据,若是敏感数据则进行标记,敏感数据识别模型对待脱敏的原始数据中的每个词语进行脱敏。模型训练与优化:将更新的数据及敏感数据识别结果添加至原始数据集中,更新后的原始数据集作为部分敏感数据识别模型。例:原附件地址为[{"url":"http://60.163.157.162:31683/gds-data/20240401/04 白皮书 公共数据资源价值……打印版.pdf"}],包含了报告的文件地址,一旦泄露会造成公司资源流失,通过敏感数据识别模型对附件地址类信息进行标记并脱敏,脱敏后附件地址为[{"url":"gds-data/20240401/04 白皮书 公共数据资源价值……打印版.pdf"}]
提供机构:
国脉互联数字发展(浙江自贸区)有限公司
创建时间:
2024-08-02
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



