five

africa-maritime-port-cybersecurity

收藏
Hugging Face2026-05-13 更新2026-05-15 收录
下载链接:
https://huggingface.co/datasets/electricsheepafrica/africa-maritime-port-cybersecurity
下载链接
链接失效反馈
官方服务:
资源简介:
Maritime & Port Cybersecurity (Africa) 是一个专注于非洲海事与港口网络安全领域的合成数据集,属于Africa Cyber Threat Intelligence系列,旨在模拟针对非洲关键海事基础设施(包括港口、船舶及相关系统)的网络攻击场景。非洲拥有38个沿海国家、90多个主要商业港口以及苏伊士运河、几内亚湾等战略要道,年贸易额超万亿美元,但其海事网络安全的脆弱性在2021年南非Transnet勒索软件攻击等事件中暴露无遗。本数据集基于国际海事组织(IMO)、波罗的海国际航运公会(BIMCO)、国际刑警组织(INTERPOL)等权威机构2023-2025年的报告和指南合成,捕捉了非洲各地区(如南非、埃及、吉布提、几内亚湾、东非、北非)特有的攻击模式,例如针对港口管理系统的勒索软件、针对船舶自动识别系统(AIS)和GPS的欺骗攻击、以及对工业控制系统(SCADA/OT)的攻击等。数据集包含10,000条平衡记录(50%为攻击事件,50%为正常活动)。每条记录包含37个原始特征,详细描述了事件发生的国家、具体港口、攻击类型、目标系统、攻击向量、威胁行为者、涉及的船舶与货物类型,以及大量二元指标(如是否影响OT/IT系统、是否造成运营中断、财务损失、安全环境风险、是否与走私或海盗活动关联、检测与响应情况等)和数值指标(如延误时间、损失金额、赎金金额等)。此外,数据集还提供了一系列从原始特征中提取的衍生特征,包括系统目标分类、运营影响等级、财务损失等级、风险严重性、犯罪关联标志、检测与响应有效性评分,以及攻击类型、威胁行为者、船舶类型的独热编码或分类特征。最后,数据集还计算了三个综合评分:maritime_threat_score(威胁严重性综合评分)、economic_impact_score(经济损害综合评分)和maritime_resilience_score(检测与响应弹性综合评分)。该数据集适用于表格分类任务,特别是用于海事网络安全威胁检测、风险建模、影响评估以及相关机器学习模型的训练与验证。

Maritime & Port Cybersecurity (Africa) is a synthetic dataset focused on the maritime and port cybersecurity domain in Africa. It belongs to the Africa Cyber Threat Intelligence series and aims to simulate cyber attack scenarios targeting critical maritime infrastructure in Africa, including ports, ships, and related systems. Africa has 38 coastal countries, over 90 major commercial ports, and strategic waterways such as the Suez Canal and the Gulf of Guinea, with annual trade exceeding trillions of dollars. However, the vulnerability of its maritime cybersecurity was exposed in incidents like the 2021 Transnet ransomware attack in South Africa. This dataset is synthesized based on reports and guidelines from authoritative organizations such as the International Maritime Organization (IMO), the Baltic and International Maritime Council (BIMCO), and INTERPOL from 2023-2025, capturing region-specific attack patterns in Africa (e.g., South Africa, Egypt, Djibouti, Gulf of Guinea, East Africa, North Africa), such as ransomware targeting port management systems, spoofing attacks on ship Automatic Identification Systems (AIS) and GPS, and attacks on industrial control systems (SCADA/OT). The dataset contains 10,000 balanced records (50% attack events, 50% normal activities). Each record includes 37 raw features, detailing the country of occurrence, specific port, attack type, target system, attack vector, threat actor, involved ship and cargo types, as well as numerous binary indicators (e.g., whether OT/IT systems are affected, operational disruption, financial loss, security environmental risks, association with smuggling or piracy activities, detection and response status) and numerical indicators (e.g., delay time, loss amount, ransom amount). Additionally, the dataset provides a series of derived features extracted from the raw features, including system target classification, operational impact level, financial loss level, risk severity, crime association flags, detection and response effectiveness scores, and one-hot encoded or categorical features for attack types, threat actors, and ship types. Finally, the dataset computes three comprehensive scores: maritime_threat_score (comprehensive threat severity score), economic_impact_score (comprehensive economic damage score), and maritime_resilience_score (comprehensive detection and response resilience score). This dataset is suitable for tabular classification tasks, particularly for maritime cybersecurity threat detection, risk modeling, impact assessment, and the training and validation of related machine learning models.
创建时间:
2026-05-13
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集隶属于Africa Cyber Threat Intelligence系列,由Electric Sheep Africa团队基于真实研究数据合成构建。数据集共包含10,000条记录,采用平衡正负样本的50/50比例设计。数据生成过程充分汲取了多方权威情报来源,包括IMO海事网络安全风险管理指南、BIMCO船舶网络安全指南、INTERPOL非洲网络威胁评估报告、非盟蓝色经济战略、CyberKeel海事攻击数据库、ENISA交通威胁态势报告及Lloyd's List Intelligence非洲港口网络事件记录,确保了合成样本在统计特征与模式上的真实性。
使用方法
用户可通过HuggingFace datasets库便捷加载该数据集,仅需一行Python代码:dataset = load_dataset("electricsheepafrica/africa-maritime-port-cybersecurity")。数据集以表格分类任务形式呈现,直接适用于二分类攻击检测模型训练,亦可基于丰富的特征列开展多标签分类、异常检测、风险评分回归等进阶分析。数据集遵循MIT开源协议,科研与商业应用均可自由使用。参考引用格式已提供BibTeX条目,便于学术研究中的规范引用。
背景与挑战
背景概述
非洲大陆拥有38个沿海国家与90余个主要商业港口,苏伊士运河、几内亚湾和莫桑比克海峡等战略节点支撑着年贸易额超万亿美元的全球供应链。然而,2021年南非Transnet港口遭遇勒索软件攻击,导致德班、开普敦等主要港口瘫痪数周,这一事件暴露出非洲海事基础设施在网络安全防御上的脆弱性。为此,Electric Sheep Africa团队于2026年发布了非洲海事港口网络安全数据集,该数据集基于国际海事组织、国际刑警组织及欧洲网络安全局等权威机构的真实研究报告,通过合成技术生成了包含万余条记录的平衡样本,系统性地覆盖了非洲沿海19国25个港口的13类攻击场景,为研究非洲特殊地缘政治环境下的海事网络威胁提供了关键基础。
当前挑战
该数据集所解决的领域问题在于填补非洲海事网络安全领域结构化数据的空白。当前非洲港口正经历快速数字化,但运营技术与工业控制系统安全防护严重滞后,加之海盗活动与网络犯罪的交织(如自动识别系统操纵用于走私)、不同区域(如吉布提的军事基地网络紧张、东非中国承建港口的系统后门风险)的差异化威胁,使得通用数据集难以反映非洲真实风险图景。在构建过程中,面临的挑战包括:如何从分散的公开报告和学术文献中提取可信的威胁模式,如何基于跨区域、多类型的攻击特征生成既平衡又真实的合成样本,以及如何设计涵盖运营技术攻击、导航系统劫持、供应链连锁破坏等复合维度的特征体系以支撑有效的威胁建模与防御策略研究。
常用场景
经典使用场景
非洲海事与港口网络安全数据集(africa-maritime-port-cybersecurity)是专为研究和建模非洲沿海基础设施网络安全威胁而构建的合成数据集。该数据集涵盖了南非德班、埃及塞得港、吉布提港等25个关键非洲港口的真实攻击场景,包含19个非洲沿海国家的网络安全事件特征。数据集提供了超过70个特征变量,涵盖攻击类型(如勒索软件、GPS欺骗、SCADA攻击)、攻击向量、威胁行为者类型、目标系统(IT/OT/导航系统)以及影响指标(财务损失、运营中断、环境风险等)。研究者可利用该数据集进行多分类任务,鉴别不同类型网络攻击的独特模式,或构建二分类模型区分恶意流量与正常操作行为,为非洲港口网络安全态势感知提供数据基础。
解决学术问题
该数据集有力回应了非洲海事网络安全领域长期存在的关键学术挑战——缺乏面向非洲特定地理政治背景的结构化安全数据。传统网络安全数据集多集中于欧美港口,忽视了非洲港口在数字化进程中面临的独特漏洞,如AIS信号操纵、GPS欺骗和SCADA系统脆弱性。该数据集填补了这一空白,使研究者能够系统探究非洲港口网络攻击的分布规律、攻击向量偏好及其与走私、海盗等犯罪的关联性。通过对特征工程生成的'海事威胁评分'和'经济影响评分',学者可量化评估不同攻击类型对港口运营的实际冲击,为跨学科研究(如海事安全、国际贸易物流与网络犯罪)提供可重复分析的实证支持。
实际应用
在实际应用中,该数据集可被港口安全运营中心(SOC)、国家CERT团队以及国际航运企业用于构建威胁检测和应急响应系统。例如,基于数据集中'ransomware_incident'和'detection_time_hours'特征,可训练模型预测勒索软件攻击对港口运营的中断时长和潜在经济损失。'linked_to_smuggling'和'ais_manipulation'等特征则有助于开发识别非法贸易与海盗活动的预警系统。此外,非洲联盟和区域海事组织可借助该数据集的'regulatory_reported'和'bcp_activated'指标,评估成员国港口网络安全的合规水平与业务连续性能力,为制定针对性网络安全策略提供数据驱动的决策支持。
数据集最近研究
最新研究方向
随着非洲海洋贸易的蓬勃发展和港口数字化的快速推进,针对非洲海事关键基础设施的网络威胁日益凸显,成为国际网络安全领域的前沿焦点。该数据集聚焦于非洲38个沿海国家的90多个主要商业港口及苏伊士运河、几内亚湾等战略咽喉,通过模拟勒索软件、GPS欺骗、工业控制系统攻击及自动识别系统操控等多样化攻击向量,系统呈现了2021年南非Transnet勒索软件瘫痪主要港口等真实事件的演化模式。当前研究热点集中在分析非洲港口运营技术系统脆弱性与信息技术系统风险的融合态势,以及网络攻击与海盗、走私等跨国犯罪活动的深度耦合,旨在为构建面向非洲本土化的海事网络威胁情报体系提供关键训练数据,对于保护年贸易额超万亿美元的蓝色经济命脉具有重要战略意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作