NSL-KDD Dataset|网络安全数据集|数据分析数据集
收藏NSLKDD-Dataset 数据集概述
数据集描述
- 名称: NSLKDD-Dataset
- 目的: 用于WEKA的数据集,适用于算法验证和研究。
- 修改内容: 对原始数据集进行了轻微修改,包括攻击类别的细分,如DOS、U2R等,并使用实数值进行编码。
数据集特征
- 攻击类别编码: 在新的字段
xAttack
中,为不同类型的攻击分配了实数值:- dos = [1]
- u2r = [2]
- r2l = [3]
- probe = [4]
- normal = [5]
- unknown = [6]
- 二元分类: 数据集经过处理,
xAttack
字段用于二元分类,其中0代表正常流量,1代表恶意流量。 - 数据分割: 数据集分为训练和验证部分,采用20%的分割比例,其中66%用于训练,34%用于验证。
- 特征编码: 字段
flag
,service
, 和protocol_type
已从类别值转换为数值。
数据集使用建议
- 研究适用性: 尽管有观点认为NSL-KDD数据集过时且不真实,但在建立研究方法、算法或解决方案时,提供比较结果是必要的。建议在研究中使用此数据集后,再应用于合成数据集。
- 多类别分类: 如需基于
xAttack
字段进行多类别分类,可联系数据集提供者。
引用信息
- 研究论文: Botes, F., Leenen, L., and De La Harpe, R. (2017). Ant Colony Induced Decision Trees for Intrusion Detection. In: 16th European Conference on Cyber Warfare and Security. ACPI, pp.74-83.
- 原始数据集创建者: M. Tavallaee, E. Bagheri, W. Lu, and A. Ghorbani, “A Detailed Analysis of the KDD CUP 99 Data Set,” 2009.

URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录
Beijing Traffic
The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.
Papers with Code 收录
FAOSTAT Agricultural Data
FAOSTAT Agricultural Data 是由联合国粮食及农业组织(FAO)提供的全球农业数据集。该数据集涵盖了农业生产、贸易、价格、土地利用、水资源、气候变化、人口统计等多个方面的详细信息。数据包括了全球各个国家和地区的农业统计数据,旨在为政策制定者、研究人员和公众提供全面的农业信息。
www.fao.org 收录
jojogo9/freshness
该数据集包含图像及其对应的标签,标签分为6类:腐烂的橙子、腐烂的香蕉、腐烂的苹果、新鲜的橙子、新鲜的香蕉、新鲜的苹果。数据集分为训练集和测试集,训练集包含10908个样本,测试集包含2705个样本。数据文件存储在指定的路径下。
hugging_face 收录