Smart Grid Datasets
收藏github2026-03-20 更新2026-03-17 收录
下载链接:
https://github.com/wbw625/smart-grid-datasets
下载链接
链接失效反馈官方服务:
资源简介:
一个精心策划的公共数据集集合,用于智能电网安全研究,涵盖日志分析和入侵检测。
A carefully curated collection of public datasets for smart grid security research, covering log analysis and intrusion detection.
创建时间:
2026-03-09
原始信息汇总
Smart Grid Datasets 数据集概述
数据集简介
这是一个为智能电网安全研究精选的公共数据集集合,涵盖日志分析和入侵检测两个主要领域。
数据集分类与详情
1. 日志分析
| 数据集名称 | 来源链接 |
|---|---|
| Six-Month Monitoring Dataset From a Ten-Turbine Onshore Wind Farm in Greece (SMD10TOWFGR) | https://zenodo.org/records/15781269 |
| Sherlock: A Dataset for Process-aware Intrusion Detection Research on Power Grid Networks | https://zenodo.org/records/18467070 |
2. 入侵检测
| 数据集名称 | 来源链接 |
|---|---|
| ERENO | https://www.kaggle.com/datasets/sequincozes/ereno-iec61850-ids/data |
| SANDI-2024 | https://zenodo.org/records/15487636 |
| IEC 60870-5-104 Intrusion Detection Dataset | https://zenodo.org/records/7108614 |
| DNP3 Intrusion Detection Dataset | https://ieee-dataport.org/documents/dnp3-intrusion-detection-dataset |
| ICS Cyber Attack Datasets — Power System Datasets | https://sites.google.com/a/uah.edu/tommy-morris-uah/ics-data-sets |
| Network Traffic Dataset IEC-61850 Cyber Attacks | https://www.kaggle.com/datasets/johnatandeoliveira/network-traffic-dataset-iec-61850-cyber-attacks |
| EPIC Attack Datasets (EPIC-A / EPIC-B) | https://github.com/smartgridadsc/EPIC_Attack_Datasets |
贡献者
- 上海交通大学 AI Security Lab (https://sjtuaiseclab.github.io/)
- Gongshen Liu (https://infosec.sjtu.edu.cn/DirectoryDetail.aspx?id=75)
- Bowen Wang (https://github.com/wbw625)
- Jinming Hu (https://github.com/jmh2003)
- Yi Hua (https://github.com/illusionhi)
- Luoyun Wang (https://github.com/WatanabeChika)
搜集汇总
数据集介绍

构建方式
在智能电网安全研究领域,数据集的构建通常遵循系统性收集与精心筛选的原则。Smart Grid Datasets通过整合多个公开来源,聚焦于日志分析与入侵检测两大核心方向。其构建过程涉及从风电场监控系统、电力网络过程感知研究以及多种工业通信协议(如IEC 61850、IEC 60870-5-104、DNP3)中提取真实或模拟的网络安全数据。这些数据经过标准化处理与标注,形成结构化的资源集合,旨在为研究人员提供覆盖广泛攻击场景的基准测试材料。
特点
该数据集的特点体现在其高度的专业性与多样性。它专门针对智能电网的安全威胁设计,涵盖了从风力发电设施的操作日志到针对关键工业协议的复杂网络攻击数据。数据集不仅包含正常操作记录,还细致模拟了多种入侵模式,如中间人攻击、拒绝服务等,从而全面反映了电网系统面临的潜在风险。其多源异构的数据形态,包括时间序列日志与网络流量捕获,为开发鲁棒的检测模型提供了丰富的特征空间。
使用方法
研究人员可利用该数据集进行智能电网安全领域的多项实证研究。在日志分析方面,数据集支持对风力涡轮机等设备运行状态进行异常检测与故障预测模型的训练与验证。对于入侵检测任务,其包含的各类协议攻击数据可用于开发和评估基于机器学习或深度学习的分类器,以识别恶意流量与行为模式。使用前,建议根据具体研究目标(如协议特异性攻击检测或跨场景泛化能力测试)选择相应的子集,并遵循数据提供者描述的预处理步骤进行特征工程与数据划分。
背景与挑战
背景概述
智能电网作为现代能源系统的核心,其网络安全研究对于保障关键基础设施的稳定运行至关重要。近年来,随着电网数字化与互联程度的加深,针对工控系统的网络攻击事件频发,促使学术界与工业界亟需高质量的数据集以支撑入侵检测与日志分析等安全技术研发。在此背景下,上海交通大学AI Security Lab的研究团队于近期系统性地收集并整理了Smart Grid Datasets,该资源库汇聚了多个公开可用的智能电网安全数据集,涵盖了从风力发电场运行日志到多种工控协议攻击流量等多个维度,旨在为研究人员提供一个标准化、可复现的实验基准,有力推动了智能电网安全领域的实证研究进展。
当前挑战
智能电网安全数据集所应对的核心挑战在于如何精准识别与分类针对复杂工控环境的多样化网络攻击,这些攻击往往利用特定协议(如IEC 61850、DNP3)的漏洞,且攻击模式隐蔽多变,对检测模型的泛化能力提出了极高要求。在数据集构建过程中,研究人员面临多重困难:真实电网环境数据获取涉及敏感性与隐私保护,往往难以公开;攻击场景的模拟需要深度理解工控协议与系统业务流程,以确保数据的真实性与代表性;此外,不同来源数据的格式异构、标注质量不一,也给数据的清洗、整合与标准化带来了显著挑战。
常用场景
经典使用场景
在智能电网安全研究领域,该数据集为日志分析与入侵检测提供了关键的数据支撑。研究人员常利用其中的风电场监控日志或过程感知入侵检测数据集,构建基于机器学习的异常检测模型,以识别电网运行中的潜在安全威胁。这些场景不仅模拟了真实电网环境下的数据流,还涵盖了从设备层到网络层的多维度攻击模式,为算法验证与性能评估奠定了坚实基础。
衍生相关工作
围绕该数据集,衍生了一系列经典研究工作。例如,基于Sherlock数据集的流程挖掘技术被用于建模电网正常行为基线,从而检测偏离预期的入侵;而ERENO数据集则催生了针对IEC 61850协议的深度学习检测框架。这些工作不仅拓展了数据集的学术价值,还形成了从特征工程到实时监控的完整研究链条,持续推动着智能电网安全领域的进步。
数据集最近研究
最新研究方向
在智能电网安全领域,数据集的最新研究方向聚焦于过程感知入侵检测与多协议攻击分析。随着电网系统数字化程度加深,针对工业控制协议的针对性攻击日益增多,研究前沿正从传统网络流量监测转向结合日志分析与行为建模的综合性防御。例如,基于Sherlock数据集的过程感知方法能够追踪电网网络中的异常操作序列,而ERENO和SANDI-2024等数据集则推动了针对IEC 61850和IEC 60870-5-104协议的细粒度攻击检测技术。这些进展不仅提升了电网基础设施的韧性,也为应对跨协议协同攻击提供了关键数据支撑,助力构建自适应、可解释的智能电网安全体系。
以上内容由遇见数据集搜集并总结生成



