africa-telecom-infrastructure-attacks
收藏Hugging Face2026-05-15 更新2026-05-16 收录
下载链接:
https://huggingface.co/datasets/electricsheepafrica/africa-telecom-infrastructure-attacks
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个合成的、平衡的表格分类数据集,专门用于建模和分析针对非洲电信基础设施的网络攻击。它包含10,000条记录(50%为攻击,50%为正常),所有记录均为合成数据。其核心目标是捕捉非洲移动优先环境(拥有6.15亿用户)中独特的电信安全威胁,这些威胁因安全投资不足(例如,少于30%的非洲移动网络运营商部署信令防火墙)和传统2G/3G网络(存在已知SS7漏洞)占主导地位而加剧。数据内容广泛覆盖了多种攻击类型,包括SIM交换欺诈、Diameter信令攻击、GTP隧道利用、SS7位置跟踪/呼叫短信拦截、IMSI捕获器监控、SIP/VoIP欺诈、BTS基站欺骗、5G NRF/SEPP利用、DNS/BGP劫持、海底电缆中断、核心网络入侵、CDR计费欺诈、OTA SIM攻击、合法监听滥用、物理基础设施攻击(如塔楼破坏、电缆/柴油盗窃)以及移动货币平台攻击等。数据集模拟了跨越2G到5G的多种协议(如SS7 MAP/ISUP/CAP、Diameter S6a/Gx/Rx、GTP、SIP、PFCP、HTTP/2 SBI)以及关键的运输层和服务层基础设施(如BGP/DNS、移动货币API)。特别强调了非洲特有的攻击模式和背景,例如南非的SIM交换流行病、尼日利亚的SIM注册欺诈和BTS欺骗、肯尼亚通过SIM交换针对M-Pesa的金融盗窃、埃及作为监控瓶颈的电信网络,以及将SIM交换与移动货币访问相结合的独特非洲攻击链。还考虑了区域性风险因素,如广泛使用的中国供应商(华为/中兴)核心网络设备、对海底电缆(如WACS、SAT-3、EASSy)的依赖(构成单点故障),以及物理盗窃和破坏等现实威胁。每条数据记录包含63个特征字段,详细描述了攻击的属性、影响和响应情况,关键字段包括攻击类型、目标国家、利用的协议、威胁行为者类型、所需访问级别、是否利用传统协议/Diameter/5G协议、是否涉及中国设备、SIM交换的具体方法、是否以移动货币或监控为目标、受影响用户和服务的规模指标、财务损失、物理破坏指标、检测与响应措施以及最终的二元分类标签(攻击或正常)。数据集还包含衍生特征,用于计算威胁评分、风险评分和生成各类别的一热编码。它适用于电信网络安全、威胁情报分析、攻击检测模型开发(分类任务)以及研究非洲特定网络威胁格局等任务。数据基于GSMA、ENISA、INTERPOL、Citizen Lab和AdaptiveMobile Security等机构的真实世界研究和报告生成,旨在为学术研究和安全工具开发提供高质量的合成基准数据。
This dataset is a synthetic, balanced tabular classification dataset specifically designed for modeling and analyzing network attacks targeting African telecommunications infrastructure. It contains 10,000 records (50% attack, 50% normal), all labeled as synthetic data. Its core objective is to capture the unique telecommunications security threats in Africas mobile-first environment (with 615 million users), exacerbated by insufficient security investments (e.g., less than 30% of African mobile network operators deploy signaling firewalls) and the dominance of legacy 2G/3G networks (with known SS7 vulnerabilities). The data broadly covers various attack types, including SIM swap fraud (for stealing mobile money/banking funds), Diameter signaling attacks, GTP tunneling exploits, SS7 location tracking/call SMS interception, IMSI catcher surveillance, SIP/VoIP fraud, BTS base station spoofing, 5G NRF/SEPP exploitation, DNS/BGP hijacking, submarine cable disruptions, core network intrusions, CDR billing fraud, OTA SIM attacks, lawful interception abuse, physical infrastructure attacks (such as tower vandalism, cable/diesel theft), and mobile money platform attacks. The dataset simulates multiple protocols spanning from 2G to 5G (e.g., SS7 MAP/ISUP/CAP, Diameter S6a/Gx/Rx, GTP, SIP, PFCP, HTTP/2 SBI) and key transport and service layer infrastructure (e.g., BGP/DNS, mobile money APIs). It particularly emphasizes Africa-specific attack patterns and contexts, such as the SIM swap epidemic in South Africa, SIM registration fraud and BTS spoofing in Nigeria, financial theft targeting M-Pesa via SIM swap in Kenya, Egypts telecommunications networks as surveillance bottlenecks, and unique African attack chains combining SIM swap with mobile money access. Additionally, it considers regional risk factors, such as the widespread use of Chinese vendor (Huawei/ZTE) core network equipment, reliance on submarine cables (e.g., WACS, SAT-3, EASSy) as single points of failure, and realistic threats like physical theft and vandalism. Each data record includes 63 feature fields detailing attack attributes, impacts, and responses, with key fields covering attack type, target country, exploited protocol, threat actor type, required access level (network, internal, physical), whether legacy/Diameter/5G protocols are exploited, involvement of Chinese equipment, specific SIM swap methods, targeting of mobile money or surveillance, scale metrics for affected users and services, financial losses, physical damage indicators, detection and response measures (e.g., deployment of signaling firewalls, incident response), and a final binary classification label (attack or normal). The dataset also includes derived features for calculating threat scores, risk scores, and generating one-hot encodings for various categories. It is suitable for tasks such as telecommunications network security, threat intelligence analysis, attack detection model development (classification tasks), and research on Africa-specific cyber threat landscapes. The data is generated based on real-world studies and reports from organizations like GSMA, ENISA, INTERPOL, Citizen Lab, and AdaptiveMobile Security, aiming to provide high-quality synthetic benchmark data for academic research and security tool development.
创建时间:
2026-05-13
原始信息汇总
数据集概述:非洲电信基础设施攻击(超越 SS7)
该数据集属于 Africa Cyber Threat Intelligence 系列,由 electricsheepafrica 提供,专注于模拟非洲电信基础设施面临的各类攻击威胁。
基本信息
- 数据集名称:Telecommunications Infrastructure Attacks (Beyond SS7) — Africa Cyber Threat Intelligence
- 语言:英语
- 许可证:MIT
- 任务类型:表格分类(tabular-classification)
- 数据规模:10,000 行(平衡数据集,正负样本各 50%)
- 数据性质:全部为合成数据(is_synthetic=1),基于真实世界研究数据生成
数据集背景与地域特征
数据聚焦非洲移动优先的电信环境,覆盖:
- 南非:Vodacom/MTN SIM 卡交换欺诈(年损失超 3 亿兰特)、Cell C 数据泄露、海底电缆依赖
- 尼日利亚:MTN Nigeria SIM 注册欺诈、NCC 监管漏洞、拉各斯 BTS 伪基站攻击
- 肯尼亚:Safaricom M-Pesa SIM 换卡导致金融盗窃、IMSI 捕获器监控报告
- 埃及:Telecom Egypt 监控瓶颈、亚历山大港电缆着陆点风险
- 全非洲通用:SIM 换卡 → 移动货币访问 → 金融盗窃(独特攻击链)
攻击类型(共 19 类)
| 攻击类型 | 说明 |
|---|---|
| sim_swap_fraud | SIM 换卡用于移动货币/银行盗窃 |
| diameter_signalling_attack | 4G/LTE Diameter 协议利用 |
| gtp_tunnel_exploitation | GTP 隧道攻击 |
| ss7_location_tracking | SS7 用户位置追踪 |
| ss7_call_sms_intercept | SS7 通话/SMS 拦截 |
| imsi_catcher_surveillance | 伪基站监控 |
| sip_voip_fraud | SIP/VoIP 话费欺诈 |
| bts_base_station_spoofing | 流氓基站攻击 |
| 5g_nrf_exploitation | 5G 网络存储功能攻击 |
| 5g_sepp_bypass | 5G 安全边缘保护代理绕过 |
| dns_hijacking_telecom | 电信基础设施 DNS 劫持 |
| bgp_hijacking | BGP 路由劫持 |
| submarine_cable_disruption | 海底电缆攻击/切断 |
| core_network_intrusion | 核心网络入侵 |
| cdrs_billing_fraud | CDR 操纵/计费欺诈 |
| ota_sim_attack | 空中 SIM 工具包攻击 |
| lawful_intercept_abuse | 合法拦截能力滥用 |
| physical_infrastructure_attack | 铁塔/电缆/设备物理攻击 |
| mobile_money_platform_attack | 移动货币平台攻击 |
| roaming_fraud | 漫游互联欺诈 |
协议建模
| 协议 | 代际 | 说明 |
|---|---|---|
| SS7 MAP/ISUP/CAP | 2G/3G | 传统信令(非洲仍占主导) |
| Diameter S6a/Gx/Rx | 4G LTE | 随 LTE 扩展而增长的攻击面 |
| GTP v1/v2 | 3G/4G | GPRS 隧道协议 |
| SIP/RTP | 全代际 | IP 语音 |
| PFCP | 5G | 分组转发控制协议 |
| HTTP/2 SBI | 5G | 5G 服务化接口 |
| BGP/DNS | 传输层 | 路由和命名基础设施 |
| OTA SMS/USSD | 2G-4G | SIM 管理通道 |
| Mobile Money API | 服务层 | M-Pesa 等平台 |
海底电缆建模
WACS · SAT-3 · EASSy · SEACOM · 2Africa · MainOne · ACE · Equiano · PEACE
特征列说明(共 50+ 列)
| 类别 | 列名示例 |
|---|---|
| 基础信息 | record_id, country, attack_type, network_layer, protocol_exploited, threat_actor, target_operator, network_generation |
| 访问条件 | requires_network_access, requires_insider_access, requires_physical_access |
| 协议利用 | exploits_legacy_protocol, exploits_diameter, exploits_5g_protocol, exploits_vendor_backdoor |
| SIM 换卡 | sim_swap_social_engineering, sim_swap_insider_collusion, sim_swap_document_forgery, mobile_money_targeted |
| 监控相关 | surveillance_purpose, targets_journalist_activist, targets_political_figure, commercial_spyware_used |
| 影响规模 | subscribers_affected, calls_intercepted, sms_intercepted, locations_tracked |
| 经济损失 | financial_loss_usd, revenue_loss_per_hour_usd, fraud_revenue_usd |
| 物理攻击 | cable_cut, tower_vandalised, fibre_stolen, diesel_theft, submarine_cable_name |
| 检测与响应 | detected, time_to_detect_hours, detected_by, signalling_firewall_deployed, incident_response_activated, regulator_notified, gsma_reported, law_enforcement_involved, patch_applied |
| 标签 | label(1=攻击,0=合法) |
| 标记 | is_synthetic(全部为1) |
衍生特征
- 协议利用类:legacy_protocol, diameter_attack, fiveg_attack, beyond_ss7
- SIM 换卡链:is_sim_swap, sim_swap_mobile_money
- 监控类:surveillance_attack, authoritarian_surveillance, targets_civil_society
- 物理攻击类:physical_attack, submarine_cable_attack, infrastructure_theft
- 影响规模:mass_subscriber_impact, nationwide_impact
- 拦截类:interception_attack, mass_surveillance
- 财务影响:any_financial_loss, high_fraud
- 防御态势:has_signalling_firewall, effective_response
- 独热编码攻击类型(21 种):type_sim_swap, type_diameter, type_5g_nrf 等
- 代际标记:gen_2g, gen_4g, gen_5g, gen_legacy
- 行为者类型:actor_state, actor_sim_swap_gang, actor_surveillance_vendor
- 区域标记:is_west_africa, high_mobile_country
- 综合评分:telecom_threat_score, surveillance_risk_score, infrastructure_resilience_score
数据来源
- GSMA Mobile Economy Africa 2024
- ENISA Telecom Security Incidents Report 2024
- Europol/INTERPOL SIM-swapping reports 2024-2025
- GSMA FS.11 SS7/Diameter Security Guidelines 2024
- 3GPP 5G Security Architecture (TS 33.501)
- AdaptiveMobile Security — Simjacker & African MNO vulnerabilities
- Citizen Lab — Pegasus/surveillance via African telecom
- INTERPOL Africa Cyberthreat Assessment 2025
搜集汇总
数据集介绍

构建方式
该数据集名为africa-telecom-infrastructure-attacks,由Electric Sheep Africa构建,属于非洲网络威胁情报系列。所有10,000条记录均为合成数据,基于真实研究数据并保持50/50的类别平衡。数据集模拟了从传统SS7到5G核心网络的非洲电信基础设施攻击,涵盖SIM卡交换欺诈、监控利用及物理基础设施攻击等多样场景。构建过程中,参考了GSMA、ENISA、INTERPOL等权威报告,并融入了非洲特有的威胁模式,如南非的SIM卡交换损失、尼日利亚的BTS欺骗及埃及的监控瓶颈。特征设计精细,包括攻击类型、协议利用、威胁行为者等63个维度,并附加了提取特征如协议利用标记、金融影响指标和防御态势评分,以确保合成的威胁场景高度逼真。
特点
此数据集的特点在于其全面聚焦非洲电信安全,涵盖从2G到5G的协议栈,包括SS7、Diameter、GTP及5G NRF/SEPP等。它专门捕捉了非洲大陆的独特威胁链,如SIM卡交换与移动货币盗窃的关联、海底电缆的单点故障风险,以及华为/中兴设备在70%以上非洲移动网络运营商中的潜在后门风险。数据集还区分了物理攻击(如电缆窃取、基站破坏)、监控滥用(如IMSI捕获器、飞马间谍软件)和金融欺诈,并提供了丰富的攻击分类(20种)和真实场景参数,如受影响用户数、财务损失、服务中断时长等。这些特征使其成为研究非洲电信威胁态势和防御策略的宝贵资源。
使用方法
使用该数据集时,可通过Hugging Face的datasets库直接加载:调用`load_dataset('electricsheepafrica/africa-telecom-infrastructure-attacks')`即可获取。数据集适用于表格分类任务,用户可基于攻击类型、网络层、协议等特征构建分类模型,识别异常或攻击行为。其特征向量包含二进制标记(如是否利用5G协议)和数值字段(如财务损失),便于进行监督学习或威胁评分分析。此外,提取特征如`telecom_threat_score`和`surveillance_risk_score`可直接用于评估威胁等级。研究者还可结合非洲国家标签(20个国家)进行区域化分析,或利用`label`列(攻击/合法)进行二分类任务。数据集遵循MIT许可,使用前建议引用相关研究来源。
背景与挑战
背景概述
该数据集由Electric Sheep Africa于2026年创建,聚焦非洲电信基础设施攻击这一关键研究领域。非洲拥有超过6.15亿移动用户(GSMA 2024),是全球移动优先特征最为显著的地区,然而其电信安全投资严重滞后——不足30%的移动网络运营商部署了信令防火墙,且以存在已知SS7漏洞的2G/3G网络为主。该数据集通过10,000条合成样本(平衡正负样本各50%),系统建模了从传统SS7到5G核心网络、SIM卡交换诈骗、监控滥用及物理基础设施破坏等多维攻击向量,覆盖南非、尼日利亚、肯尼亚、埃及等20个非洲国家的运营商实际威胁态势。其核心研究问题在于揭示非洲电信安全链中独特的攻击路径,例如SIM卡交换与移动货币钱包的联动盗窃、海底电缆作为国家通信命脉的单点脆弱性,以及中国厂商设备占非洲MNO网络70%以上所引入的供应链风险。这一数据集为非洲网络安全威胁情报领域提供了首个结构化、跨协议、多维度的攻击知识库,对指导区域电信防护策略和国际安全政策具有重要的学术与实践价值。
当前挑战
该数据集所解决的领域挑战核心在于非洲电信安全生态中多代网络协议并存导致的攻击面扩张——从落后的2G SS7信令协议到5G的NRF/SEPP服务化接口,攻击者可利用不同层次的协议漏洞实施差异化威胁,而运营商普遍缺乏跨协议的统一检测与防护体系。构建过程中面临的主要挑战包括:如何基于真实研究数据合成高保真样本以弥补非洲地区电信事件公开记录的严重缺失(例如,SIM卡交换社会化工程的统计数据)、如何统一建模物理破坏(如光缆盗窃、基站柴油偷盗)与逻辑攻击(如Diameter信令欺诈)两种截然不同的威胁形态,以及如何在国际主流信令安全框架(GSMA FS.11)基础上合理映射本土特有的攻击链(如针对M-Pesa等移动支付平台的API级攻击)。此外,数据集通过引入中文厂商设备后门暴露度、目标用户属性(记者/反对派)等敏感维度的特征,识别与去隐私化之间的平衡构成了另一隐形的构建挑战。
常用场景
经典使用场景
在电信安全与网络威胁智能分析领域,该数据集常被用于构建面向非洲电信基础设施攻击的机器学习分类模型,涵盖从传统SS7信令漏洞到5G核心网协议攻击、SIM卡交换欺诈及物理基础设施破坏等多维攻击类型。研究者可利用此数据集训练攻击检测系统,例如通过特征工程提取协议类型、攻击向量、影响范围等指标,实现攻击事件与常规合法流量的二分类判别。其合成数据特性确保了隐私合规性与样本均衡性,尤其适合非洲移动金融生态中SIM卡交换与移动货币平台攻击的建模分析。
解决学术问题
该数据集系统性地解决了一个关键学术盲区:非洲电信网络特有的复合安全威胁缺乏结构化、可量化研究语料。它弥补了传统安全数据集(如CICIDS)对发展中国家电信场景的覆盖不足,重点揭示了SIM卡交换串联移动货币盗窃、海底光缆单点失效、中国设备后门风险及国家监控滥用等独特攻击链条。研究团队可借助此数据集实证分析非洲地区安全防护滞后(如信令防火墙部署率低于30%)与攻击成功率之间的相关性,为发展中国家电信安全经济学理论提供定量基础。
衍生相关工作
该数据集已衍生出多项前沿工作:基于其合成样本的安全研究人员开发了非洲特定攻击链的因果推理模型,量化SIM卡交换—移动货币盗窃链中的资金损失与检测延迟关系;另有团队提取电信威胁复合评分(telecom_threat_score)特征,构建非洲国家级的电信韧性排名,揭示西非地区较东部面临更高监控风险;此外,结合GSMA与INTERPOL报告,研究者提出了面向非洲的‘5G安全过渡约束模型’,指出若不经Diameter漏洞修补直接部署5G NSA架构,将引入新型NRF/SEPP攻击面。
以上内容由遇见数据集搜集并总结生成



