基于改进ID3决策树的敏感数据分类数据集
收藏国家基础学科公共科学数据中心2026-01-30 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=678d983b195d2668070f2792&type=1
下载链接
链接失效反馈官方服务:
资源简介:
实验数据集包含3387条敏感数据,分为四个敏感级别:2353条公共数据、680条外部敏感数据、156条内部部门间敏感数据和198条内部部门内敏感数据。每条数据包含7个特征,其中6个为条件特征,1个为决策特征(敏感性水平),确保了数据的全面性和分类的精确性。数据集按照7:3的比例分为训练集(2370条)和测试集(1017条)。在分类实验中,通过改进ID3决策树算法,引入属性加权优化信息增益计算公式,解决了传统ID3算法的多值倾向问题。实验采取递归方式构造决策树,在每次分裂中选取最大信息增益的属性作为依据,直至完成所有数据的分类。实验在相同的数据集规模下进行,以全面评估改进ID3决策树的性能,实验结果包括分类准确性和鲁棒性分析,验证了算法在实际工业场景中的实用性。
提供机构:
东北大学
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含3387条敏感数据,每条数据具有7个特征,并划分为四个敏感级别,按照7:3的比例分为训练集和测试集。它通过改进ID3决策树算法,引入属性加权优化信息增益,以解决传统算法的多值倾向问题,并用于评估分类准确性和鲁棒性,验证算法在实际工业场景中的实用性。
以上内容由遇见数据集搜集并总结生成



