five

分类分级工具集数据集

收藏
国家基础学科公共科学数据中心2026-01-30 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=67d50f23195d260905af9a75&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集用于分类分级工具与知识图谱库的功能和性能测试;该数据集包含52个场景(包括安防监控类场景,安全管理类场景,本地生活类场景,餐饮外卖类场景,宠物照顾类场景,地图导航类场景,电话有线电视入网类场景,电信业务使用类场景,电子图书类场景,短视频类场景,二手车交易类场景,房屋租售类场景,婚恋相亲类场景,即时通信类场景,家庭维修类场景等52个),涵盖15种类别,包括90个属性,总计5400万个人信息数据(本数据集中source_data.sql中包含数据表结构及5400万条数据信息,52个场景所有的属性进行去重处理得到90个属性,将这些属性设置到分类模板所配置的15个类别中),个人数据不涉及个人隐私,个人信息数据均采用模拟的方式生成,均进行脱敏操作。其中,90个属性依据预先定义的分类模板设置为15个类别。数据集压缩前7.78GB,满足数据集上传数据量大小的要求,压缩后184MB。
提供机构:
中国科学院信息工程研究所
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集用于分类分级工具和知识图谱库的功能与性能测试,包含52个场景、15个类别、90个属性,总计5400万条模拟生成的脱敏个人信息数据。数据压缩前为7.78GB,压缩后为184MB,满足数据集上传要求。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务