five

脱敏效果评测系统的模拟数据集

收藏
国家基础学科公共科学数据中心2026-01-30 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=67d50f26195d260905af9a7e&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
在脱敏效果评测系统中,样本数据主要用于为评测提供比对依据。样本数据基于个人敏感信息按需脱敏工具集模拟数据集构建。对于表格和文本模态数据,表格模态数据个人敏感信息按需脱敏工具集模拟数据集中的52个典型应用场景数据集构建,对于图像、视频、音频、图形模态数据针对非结构化数据,图像、视频、音频模态与个人敏感信息按需脱敏工具集模拟数据集中图像、视频、音频模态的图像、视频、音频、图形各模态1000条数据保持一致。样例数据用于验证脱敏算法在不同模态数据上的表现。样例数据的生成基于6000万人的个人信息数据,并结合文本、表格和非结构化数据的特定脱敏算法,构造多模态脱敏样例。1)对于文本和表格模态数据,基于场景数据集,结合多种脱敏算法,如随机置换、尾部截断等,生成不同版本的脱敏样例数据。2)对于如图像、视频、音频和图形模态数据,通过特定的脱敏技术生成脱敏样例。具体方法,针对图像数据进行模糊处理或图像加扰;针对视频数据应用视频模糊;针对音频数据进行频率变换;针对轨迹数据进行随机扰动。
提供机构:
中国科学院信息工程研究所
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集为脱敏效果评测系统提供模拟样本,基于个人敏感信息按需脱敏工具集构建,涵盖表格、文本、图像、视频、音频和图形等多种模态数据。它通过应用随机置换、模糊处理、频率变换等特定脱敏算法,生成多模态脱敏样例,用于验证脱敏算法的表现。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务