BATADAL dataset
收藏github2023-04-19 更新2024-05-31 收录
下载链接:
https://github.com/SYChen123/A-survey-on-BATADAL-dataset
下载链接
链接失效反馈官方服务:
资源简介:
BATADAL数据集是一个用于水分配系统中异常检测的多变量时间序列数据集。
The BATADAL dataset is a multivariate time series dataset designed for anomaly detection in water distribution systems.
创建时间:
2020-06-29
原始信息汇总
数据集概述
数据集名称
BATADAL数据集
数据集描述
BATADAL数据集是一个多变量时间序列数据集,用于在水分配系统背景下的异常检测。该数据集在以下出版物中提出: Taormina R, Galelli S, Tippenhauer N O, et al. Battle of the Attack Detection Algorithms: Disclosing cyber attacks on water distribution networks[J]. Journal of Water Resources Planning and Management, 2018, 144(8).
数据集详细信息
数据集的详细信息可以在以下链接找到:
- https://github.com/scy-phy/www.batadal.net
- http://www.batadal.net/
研究概述
BATADAL竞赛
-
Housh et al.
- 方法:模型驱动方法,首先基于部分SCADA读数估计需求,然后使用EPANET模拟水力学,计算SCADA读数与模拟值之间的误差,最后应用移动平均和决策规则在误差上查找异常。
- 论文:Model-based approach for cyber-physical attack detection in water distribution systems
-
Abokifa et al.
- 方法:数据驱动方法,三层框架。第一层使用均值和标准差从统计角度检测明显异常。第二层使用多层感知器(MLP)检测上下文异常,输入数据经过FFT和三阶低通Butterworth滤波器处理。第三层使用PCA,将主成分转换为两个子空间:正常子空间和异常子空间。
- 论文:Detection of Cyber Physical Attacks on Water Distribution Systems via Principal Component Analysis and Artificial Neural Networks
-
Giacomoni et al.
- 方法:数据驱动方法,基于凸优化。首先应用执行器规则验证和数据验证,然后应用基于优化的检测算法进一步检测攻击。
- 论文:Identification of Cyber Attacks on Water Distribution Systems by Unveiling Low-Dimensionality in the Sensory Data
-
Brentan et al.
- 方法:数据驱动方法,应用NARX模型预测水分配系统的未来状态,然后使用误差项的标准偏差检测和定位可能的异常。
- 论文:On-line cyber attack detection in water networks through state forecasting and control by pattern recognition
-
Chandy et al.
- 方法:数据驱动方法,包括两部分。第一部分是基于规则的方法,检查操作/物理规则是否被破坏。第二部分使用卷积变分自动编码器确认标记事件。
- 论文:Detection of cyber-attacks to water systems through machine-learning-based anomaly detection in scada data
-
Posha et al.
- 方法:数据驱动方法,包括三个模块。第一模块检查数据点是否与控制规则一致。第二模块是模式识别。第三模块基于水分配系统组件之间的关系确认攻击事件。
- 论文:An approach to detect the cyber-physical attack on water distribution system
-
Aghashahi et al.
- 方法:数据驱动方法,算法包括三部分。第一部分预处理数据。第二部分训练随机森林。第三部分测试模型。
- 论文:Water distribution systems analysis symposium-battle of the attack detection algorithms (BATADAL)
其他研究
-
Abdulaziz Almehmadi
- 方法:将入侵检测任务视为二元分类。首先从SCADA读数中手动提取特征,然后应用PCA选择关键特征。最后分别训练朴素贝叶斯、SVM和随机森林,看哪个算法表现最好。
- 论文:SCADA Networks Anomaly-based Intrusion Detection System
-
Erba et al.
- 方法:专注于逃避检测技术而不是检测异常。提出了白盒和黑盒攻击算法以逃避系统的检测。
- 论文:Real-time Evasion Attacks with Physical Constraints on Deep Learning-based Anomaly Detectors in Industrial Control Systems
-
Taormina et al.
- 方法:数据驱动方法,应用自动编码器到BATADAL数据集以检测和定位异常。
- 论文:Deep-Learning Approach to the Detection and Localization of Cyber-Physical Attacks on Water Distribution Systems
搜集汇总
数据集介绍

构建方式
BATADAL数据集是一个多变量时间序列数据集,专为水分配系统中的异常检测而设计。该数据集由Taormina等人于2018年提出,旨在通过模拟水分配网络中的网络攻击,提供一种评估和比较不同异常检测算法的基准。数据集的构建基于实际的水分配系统模型,结合了物理和网络攻击的模拟数据,确保了数据的真实性和实用性。
特点
BATADAL数据集的特点在于其多维度和时间序列的特性,涵盖了水分配系统中的多种传感器数据。数据集不仅包含了正常操作下的数据,还模拟了多种网络攻击场景,如数据篡改和系统干扰等。这种设计使得数据集能够全面反映水分配系统在遭受网络攻击时的行为变化,为研究者提供了一个丰富的实验平台。
使用方法
使用BATADAL数据集时,研究者通常首先对数据进行预处理,包括数据清洗和标准化。随后,可以采用多种机器学习或深度学习算法进行异常检测,如自编码器、随机森林或支持向量机等。通过比较不同算法在数据集上的表现,研究者可以评估和优化其异常检测模型的性能。此外,数据集还提供了详细的评估指标,如ROC曲线和AUC值,帮助研究者更准确地分析模型效果。
背景与挑战
背景概述
BATADAL数据集是一个多变量时间序列数据集,专注于水分配系统中的异常检测。该数据集由Taormina等人于2018年提出,旨在应对水分配系统从物理系统升级为网络物理系统后所面临的网络安全威胁。随着监控与数据采集系统(SCADA)的广泛应用,水分配系统变得更加脆弱,容易受到网络攻击。BATADAL数据集的创建为开发强大且可靠的网络攻击检测技术提供了重要支持。该数据集的研究背景涉及多个领域,包括水利工程、网络安全和机器学习,其影响力不仅限于水分配系统的安全防护,还为其他关键基础设施的网络安全研究提供了参考。
当前挑战
BATADAL数据集在解决水分配系统网络攻击检测问题时面临多重挑战。首先,数据的高维性和时间依赖性使得异常检测算法的设计复杂化,传统的统计方法难以捕捉复杂的攻击模式。其次,数据驱动的检测方法需要处理噪声和不完整数据,这对模型的鲁棒性提出了更高要求。此外,构建数据集时,研究人员需要模拟真实的网络攻击场景,同时确保数据的多样性和代表性,这对实验设计和数据生成提出了技术挑战。最后,如何在实际应用中实现实时检测并降低误报率,仍是当前研究中的一大难题。
常用场景
经典使用场景
BATADAL数据集在网络安全领域中被广泛用于检测水分配系统中的异常行为。该数据集通过模拟水分配网络中的多种传感器数据,提供了一个多变量时间序列的框架,使得研究者能够开发和测试各种异常检测算法。特别是在水分配系统升级为网络物理系统后,其脆弱性增加,BATADAL数据集成为了评估和提升网络安全防御机制的重要工具。
实际应用
在实际应用中,BATADAL数据集被用于开发和测试水分配系统中的实时网络攻击检测系统。这些系统能够实时监控网络流量和传感器数据,通过分析数据中的异常模式来识别潜在的网络攻击。此外,该数据集还被用于评估不同检测算法的性能,帮助工程师选择最适合其系统需求的解决方案,从而提高水分配系统的整体安全性。
衍生相关工作
BATADAL数据集衍生了许多相关的研究工作,包括基于深度学习的异常检测方法和网络攻击的实时识别技术。例如,Taormina等人提出的自编码器方法,通过训练模型来学习正常数据的模式,从而检测出异常数据。此外,Abokifa等人提出的基于PCA和ANN的框架,通过多层次的检测机制来提高检测的准确性。这些研究不仅推动了网络物理系统安全领域的发展,还为其他关键基础设施的安全提供了宝贵的参考。
以上内容由遇见数据集搜集并总结生成



