electricsheepafrica/africa-energy-ot-ics-dataset
收藏Hugging Face2026-05-07 更新2026-05-10 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-energy-ot-ics-dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为能源OT/ICS安全(非洲),是非洲网络威胁情报系列的一部分。它是一个包含10,000条平衡记录的合成数据集,重点关注非洲能源领域的网络安全。数据集涵盖了与操作技术(OT)和工业控制系统(ICS)安全相关的各种特征,包括设施详情、安全措施、威胁向量和风险评分等。该数据集适用于表格分类任务,采用MIT许可证发布。
The dataset is named Energy OT/ICS Security (Africa) and is part of the Africa Cyber Threat Intelligence collection. It is a synthetic dataset with 10,000 balanced rows, focusing on cybersecurity in the energy sector across Africa. The dataset includes various features related to operational technology (OT) and industrial control systems (ICS) security, such as facility details, security measures, threat vectors, and risk scores. The dataset is intended for tabular classification tasks and is available under the MIT license.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集作为非洲网络威胁情报体系的一部分,聚焦能源领域的运营技术(OT)与工业控制系统(ICS)安全。其构建以全合成方式完成,总计包含10,000条精心设计的记录,且正负样本严格遵循50:50的均衡比例。每条数据均经过缜密的模拟生成,涵盖了从电力生产、传输、分配到油气、可再生能源等多元能源子领域,确保了对非洲大陆能源基础设施安全态势的全面映射。
特点
数据集具备极为丰富的特征维度,共计100余项属性,不仅囊括了国家、能源类型、设施名称、OT系统及厂商来源等基础信息,还深入刻画了网络防御机制(如防火墙、入侵检测系统)、访问控制策略(如多因素认证、VPN)、密码管理状况、补丁更新水平、USB端口策略、日志与监控能力等关键技术指标。此外,还纳入了安全预算比例、审计周期、事件统计、员工规模等运营参数,并通过精心计算的风险评分体系对整体安全态势进行量化,为细粒度的安全分析与分类任务提供了坚实的数据基础。
使用方法
研究者可通过HuggingFace Datasets库便捷加载该数据集,使用`load_dataset("electricsheepafrica/africa-energy-ot-ics-dataset")`命令即可获取。该数据集以表格分类任务为核心设计,其丰富的标签信息使得能源OT/ICS系统的安全性评估与威胁分类成为可能。凭借其均衡的类别分布和全面的特征集,该数据集特别适用于训练和评估针对非洲能源基础设施的威胁检测模型、风险评估算法以及安全态势预测系统,为网络安全研究提供了宝贵的基准资源。
背景与挑战
背景概述
随着全球能源基础设施数字化进程加速,非洲大陆的运营技术(OT)与工业控制系统(ICS)面临日益严峻的网络安全威胁。由Electric Sheep Africa机构于2026年创建的这个非洲能源OT/ICS安全数据集,聚焦于非洲独特的能源基础设施安全态势。该数据集包含10,000条平衡的合成记录,覆盖电力生成、传输、配电以及油气、可再生能源等多种能源类型,详细记录了从安全预算、补丁管理到网络隔离、远程访问等百余个特征,旨在为非洲能源关键基础设施的威胁情报分析提供基础。作为非洲网络威胁情报系列的一部分,该数据集填补了该地区能源行业OT/ICS安全领域高质量标注数据的空白,对推动区域能源安全研究具有重要价值。
当前挑战
该数据集面临的核心挑战在于其合成数据的本质,虽然平衡的正负样本设计有利于分类模型的训练,但合成数据与真实攻击行为之间的鸿沟可能导致模型泛化能力不足。从领域问题层面,非洲能源设施普遍存在老旧系统广泛部署、安全预算有限、远程访问机制薄弱、电网薄弱环节突出等结构性脆弱性,这些非线性交织的风险因素使得构建精确的威胁分类模型极具挑战。从构建过程层面,数据集的合成生成需要精确模拟非洲54个国家多样的地理政治环境、能源类型差异及文化语言多样性,同时必须合理呈现从国家支持攻击到内部威胁、物理入侵等12种威胁向量的地域特征差异,其难度远超单一国家或地区的数据收集工作。
常用场景
经典使用场景
在能源行业数字化转型与非洲大陆关键基础设施防护需求日益交织的背景下,该数据集专为工业控制系统(ICS)与操作技术(OT)环境中的网络安全研究而设计。最经典的使用场景聚焦于基于表格数据的二分类任务,即根据能源设施的多维安全配置指标(如网络隔离状态、访问控制策略、补丁管理状况、资产关键性等),精准预测其是否曾遭受网络攻击。研究人员可通过逻辑回归、随机森林、梯度提升树或深度神经网络等模型,对10000条平衡正负样本的合成记录进行训练与评估,从而构建适用于非洲能源场景的攻击预测分类器。
实际应用
在实际产业环境中,该数据集为非洲各国能源监管机构、电力公司及油气企业的安全运维团队提供了可重用的高保真模拟数据,用于测试和验证入侵检测系统(IDS)、安全信息和事件管理(SIEM)平台的分析能力。通过模拟不同规模发电站、输电网络与配电设施的网络安全态势,安全工程师能够评估防火墙策略、多因素认证机制及网络分段设计的防护效果,识别低预算设施中的高优先风险节点。此外,该数据集还支持开展红蓝对抗演练与安全培训,帮助本土技术人员熟悉针对OT环境的勒索软件、供应链攻击及国家背景威胁的防御手段。
衍生相关工作
该数据集的发布催生了一系列围绕非洲能源OT环境安全评估的衍生研究路径。经典工作包括基于特征工程的安全态势评分模型构建,通过融合网络隔离、远程访问安全、修补缺陷、USB风险与可观测性等多个维度的复合指标,推导出设施级别的攻击脆弱性指数。另有多项研究以此为基准,对比传统机器学习与联邦学习框架下分布式能源设施的攻击预测效果,探索在不共享原始敏感数据前提下实现跨区域安全模型协同训练的可能性。此外,该数据集还衍生出针对非洲特定威胁向量(如国家资助攻击、零日漏洞利用)的深度特征分析工作,为后续开发区域自适应型ICS入侵防御系统奠定了方法论基础。
以上内容由遇见数据集搜集并总结生成



