five

SWaT Dataset|工业控制系统安全数据集|网络攻击检测数据集

收藏
itrust.sutd.edu.sg2024-11-02 收录
工业控制系统安全
网络攻击检测
下载链接:
https://itrust.sutd.edu.sg/itrust-labs_datasets/dataset_info/#swat
下载链接
链接失效反馈
资源简介:
SWaT Dataset是一个用于工业控制系统(ICS)安全研究的数据集,包含了模拟的网络攻击和正常操作的数据。该数据集由新加坡科技设计大学(Singapore University of Technology and Design)发布,旨在帮助研究人员开发和测试用于检测工业控制系统中网络攻击的算法和模型。
提供机构:
itrust.sutd.edu.sg
AI搜集汇总
数据集介绍
main_image_url
构建方式
SWaT数据集的构建基于一个真实的工业水处理测试平台,该平台模拟了现代工业水处理系统的复杂操作。数据集通过在测试平台上安装多种传感器和监控设备,实时采集了长达11天的操作数据。这些数据包括流量、压力、温度等多种物理参数,以及系统状态和操作指令。数据集的构建过程中,特别关注了数据的完整性和一致性,确保每一数据点都能准确反映系统的实际运行状态。
特点
SWaT数据集以其高度的真实性和复杂性著称,涵盖了工业水处理系统的多个关键环节。数据集中的时间序列数据具有高频率和多维度的特点,能够为研究者提供丰富的分析素材。此外,数据集还包含了系统在正常运行和遭受攻击时的状态记录,为异常检测和安全分析提供了宝贵的参考。数据集的标签信息详尽,能够支持多种机器学习和数据挖掘任务。
使用方法
SWaT数据集适用于多种工业应用场景,特别是在工业控制系统(ICS)的安全分析和异常检测领域。研究者可以利用该数据集进行模型训练和验证,开发出能够实时监测和预警系统异常的算法。数据集的高频率和多维度特性,使其在时间序列分析和预测模型构建中具有显著优势。此外,数据集的标签信息详尽,支持多种分类和回归任务,为工业控制系统的优化和安全管理提供了有力支持。
背景与挑战
背景概述
在工业控制系统(ICS)领域,安全性与可靠性一直是核心关注点。随着工业4.0的推进,工业网络与信息技术的融合带来了前所未有的效率提升,但也引入了新的安全威胁。SWaT(Secure Water Treatment)数据集由新加坡科技设计大学(SUTD)于2015年发布,旨在模拟一个真实的供水处理系统,以研究工业控制系统中的网络攻击检测。该数据集通过模拟多种网络攻击场景,为研究人员提供了一个标准化的测试平台,极大地推动了工业控制系统安全研究的发展。
当前挑战
SWaT数据集的构建过程中面临了多重挑战。首先,模拟真实工业环境中的数据生成与采集需要高度精确的传感器和控制系统,以确保数据的准确性和代表性。其次,网络攻击的多样性和隐蔽性要求数据集能够涵盖多种攻击类型,包括但不限于拒绝服务攻击、数据篡改和未授权访问。此外,数据集的规模和复杂性也带来了存储和处理上的挑战,尤其是在实时分析和异常检测方面,需要高效的算法和计算资源。
发展历史
创建时间与更新
SWaT数据集由新加坡科技设计大学(Singapore University of Technology and Design)于2015年创建,旨在为工业控制系统(ICS)的安全研究提供一个标准化的测试平台。该数据集自创建以来,未有公开的更新记录。
重要里程碑
SWaT数据集的创建标志着工业控制系统安全研究领域的一个重要里程碑。它首次提供了一个真实世界的工业水处理系统(SWaT)的运行数据,包括正常操作和受到网络攻击时的数据。这一数据集的发布,极大地推动了基于数据驱动的工业控制系统安全检测和防御技术的研究。此外,SWaT数据集还被广泛用于验证和比较不同的入侵检测系统(IDS)和异常检测算法,成为该领域研究的重要基准。
当前发展情况
目前,SWaT数据集已成为工业控制系统安全研究中的一个核心资源。它不仅被广泛应用于学术研究,还被工业界用于开发和测试新的安全解决方案。随着工业4.0和物联网(IoT)技术的快速发展,SWaT数据集的重要性进一步凸显,为研究人员提供了宝贵的实验数据,帮助他们理解和应对日益复杂的工业控制系统安全威胁。尽管该数据集自创建以来未有更新,但其原始数据和相关研究成果仍在持续推动着该领域的技术进步和创新。
发展历程
  • SWaT Dataset首次发表,由新加坡科技设计大学(Singapore University of Technology and Design)的研究团队开发,旨在用于工业控制系统(ICS)的安全测试和评估。
    2014年
  • SWaT Dataset首次应用于学术研究,特别是在工业控制系统安全领域的研究中,成为评估入侵检测系统(IDS)性能的标准数据集。
    2015年
  • SWaT Dataset被广泛应用于多个国际会议和期刊的论文中,进一步验证了其在工业控制系统安全研究中的重要性和有效性。
    2016年
  • SWaT Dataset的扩展版本发布,增加了更多的数据点和攻击场景,以支持更复杂的实验和研究。
    2017年
  • SWaT Dataset被纳入多个工业控制系统安全课程的教学材料中,成为教育和培训的重要资源。
    2018年
  • SWaT Dataset的研究成果被应用于实际工业控制系统中,帮助企业提升其安全防护能力。
    2019年
  • SWaT Dataset的持续更新和维护,确保其与最新的工业控制系统技术和安全威胁保持同步。
    2020年
常用场景
经典使用场景
在工业控制系统(ICS)领域,SWaT数据集被广泛用于评估和开发网络安全解决方案。该数据集记录了一个模拟的水处理厂在正常操作和遭受网络攻击时的实时数据,包括传感器读数、控制信号和操作状态。通过分析这些数据,研究人员能够识别异常行为,从而开发出更有效的入侵检测系统(IDS)和防御机制。
实际应用
在实际应用中,SWaT数据集为工业控制系统提供了宝贵的测试平台。网络安全专家和工程师可以利用该数据集来验证和优化他们的入侵检测系统、异常检测算法和防御策略。此外,该数据集还被用于培训和教育,帮助工程师和研究人员更好地理解和应对工业控制系统中的网络安全挑战。
衍生相关工作
基于SWaT数据集,许多经典工作得以展开。例如,研究人员开发了多种基于机器学习的入侵检测模型,这些模型能够有效识别数据集中的异常行为。此外,SWaT数据集还激发了对工业控制系统中数据隐私和安全性的深入研究,推动了相关标准的制定和实施。这些衍生工作不仅丰富了工业控制系统的安全研究,也为实际应用提供了强有力的支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

UniProt

UniProt(Universal Protein Resource)是全球公认的蛋白质序列与功能信息权威数据库,由欧洲生物信息学研究所(EBI)、瑞士生物信息学研究所(SIB)和美国蛋白质信息资源中心(PIR)联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名,整合了实验验证的高质量数据与大规模预测的自动注释内容,涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库(分为人工校验的Swiss-Prot和自动生成的TrEMBL),以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具,为基础研究和药物研发提供了无可替代的支持,成为生物学研究中不可或缺的资源。

www.uniprot.org 收录

olympics.csv

该数据集包含不同国家参加奥运会的奖牌榜,数据来源于维基百科的历届奥运会奖牌榜。

github 收录

OpenPose

OpenPose数据集包含人体姿态估计的相关数据,主要用于训练和评估人体姿态检测算法。数据集包括多视角的图像和视频,标注了人体关键点位置,适用于研究人体姿态识别和动作分析。

github.com 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

CatMeows

该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。

huggingface 收录