africa-iot-botnet-smart-device
收藏Hugging Face2026-05-15 更新2026-05-16 收录
下载链接:
https://huggingface.co/datasets/electricsheepafrica/africa-iot-botnet-smart-device
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个合成的表格分类数据集,旨在模拟非洲地区的物联网(IoT)僵尸网络招募和智能设备攻击场景。它包含10,000条平衡记录(正负样本各50%),所有数据均为基于真实世界研究报告生成的合成数据。背景源于非洲严峻的物联网安全形势,该地区拥有超过7亿台联网设备但缺乏安全防护,使其成为全球物联网威胁攻击最多的地区之一。数据集特别捕捉了非洲不同国家的特定攻击模式,如南非的智能城市项目攻击、尼日利亚的ISP路由器入侵、肯尼亚的智慧农业传感器攻击和埃及的智能电网攻击等。数据内容涵盖多种攻击类型(如僵尸网络招募、DDoS攻击、加密劫持)、设备类型(如家庭路由器、智能电表、IP摄像头)和僵尸网络家族(如Mirai变种、Gafgyt)。数据集提供约50个特征字段,包括标识与基础信息、攻击与威胁特征、设备状态与配置、影响与损失指标、检测与响应指标以及衍生特征。它适用于物联网安全威胁检测、僵尸网络行为分析等表格分类任务,并参考了NETSCOUT、卡巴斯基等权威机构2024-2025年的威胁情报报告。
This dataset is a synthetic tabular classification dataset designed to simulate IoT botnet recruitment and smart device attack scenarios in Africa. It contains 10,000 balanced records (50% positive and negative samples each), with all data being synthetic and generated based on real-world research reports. The background stems from the severe IoT security situation in Africa, where over 700 million connected devices lack security protection, making it one of the regions with the highest global IoT threat attacks. The dataset specifically captures attack patterns from different African countries, such as smart city project attacks in South Africa, ISP router invasions in Nigeria, smart agriculture sensor attacks in Kenya, and smart grid attacks in Egypt. The data covers various attack types (e.g., botnet recruitment, DDoS attacks, cryptojacking), device types (e.g., home routers, smart meters, IP cameras), and botnet families (e.g., Mirai variants, Gafgyt). It provides approximately 50 feature fields, including identification and basic information, attack and threat characteristics, device status and configuration, impact and loss metrics, detection and response indicators, and derived features. The dataset is suitable for tabular classification tasks such as IoT security threat detection and botnet behavior analysis, and references threat intelligence reports from authoritative organizations like NETSCOUT and Kaspersky for 2024-2025.
创建时间:
2026-05-13
原始信息汇总
数据集概述:IoT Botnet & Smart Device Attacks (Africa)
基本信息
- 数据集名称: IoT Botnet & Smart Device Attacks (Africa)
- 数据集主页: https://huggingface.co/datasets/electricsheepafrica/africa-iot-botnet-smart-device
- 语言: 英语
- 许可证: MIT
- 数据类型: 表格分类(tabular-classification)
- 数据规模: 10,000 行(平衡分布,50/50)
- 数据性质: 全部为合成数据(is_synthetic=1),基于真实研究数据生成
- 所属系列: Africa Cyber Threat Intelligence
数据集背景
该数据集模拟非洲国家的物联网僵尸网络招募和智能设备攻击场景。非洲拥有超过 7 亿台连接设备,但安全防护薄弱,是全球物联网威胁最严重的地区。非洲 IP 空间贡献了全球 14% 的 DDoS 僵尸网络流量,市场上充斥着使用默认凭证且缺乏更新机制的廉价中国制造设备。
针对非洲的特定模式
- 南非: 智慧城市项目、矿业 SCADA/ICS、预付费电表破解
- 尼日利亚: ISP CPE 路由器大规模入侵、家用路由器 Mirai 变种感染
- 肯尼亚: 智慧农业 IoT 传感器、M-Pesa POS 终端攻击、太阳能逆变器攻击
- 埃及: 智能电网部署、苏伊士工业 IoT
- 非洲大陆: 7 亿+设备,多数为不安全的中国通用设备,默认开放 telnet/SSH
- 独特威胁: 智能预付费电表操控窃电、太阳能逆变器僵尸网络招募
- 检测缺口: 大多数非洲 ISP 缺乏 IoT 威胁监控能力
攻击类型(12 种)
| 攻击类型 | 描述 |
|---|---|
| botnet_recruitment | 将设备招募进僵尸网络 |
| ddos_attack | 利用受感染设备发起 DDoS |
| cryptomining_hijack | 劫持设备 CPU 进行加密货币挖矿 |
| data_exfiltration | 从 IoT 设备窃取数据 |
| credential_theft_default_pass | 利用默认密码进行攻击 |
| firmware_exploitation | 利用固件漏洞进行攻击 |
| man_in_the_middle | 拦截 IoT 通信 |
| ransomware_iot | 针对 IoT/OT 的勒索软件 |
| smart_meter_manipulation | 篡改公用事业电表 |
| camera_surveillance_hijack | 劫持监控摄像头 |
| industrial_iot_sabotage | 攻击工业控制系统 |
| lateral_movement_pivot | 将 IoT 作为网络跳板 |
设备类型(12 种)
| 设备类型 | 非洲背景 |
|---|---|
| home_router | ISP 提供的 CPE,常未打补丁 |
| isp_cpe_modem | 大规模部署,使用默认凭证 |
| smart_prepaid_meter | 预付费电表,窃电目标 |
| solar_inverter_controller | 离网太阳能 IoT,快速增长 |
| ip_camera / dvr_nvr | 中国海康威视/大华,默认密码 |
| agricultural_sensor | 智慧农业,可进入农场网络 |
| pos_terminal | M-Pesa/支付终端 |
| industrial_plc_scada | 矿业和能源 SCADA |
| smart_water_meter | 市政水务 IoT |
| vehicle_tracking_device | 车队管理 IoT |
| smart_streetlight | 智慧城市基础设施 |
僵尸网络家族(6 种)
| 家族 | 描述 |
|---|---|
| Mirai_variant | 主导 IoT 僵尸网络,多个针对非洲的变种 |
| Manga_Dark_Mirai | 针对非洲路由器的 Mirai 分支 |
| Gafgyt_Bashlite | 第二常见的 IoT 僵尸网络 |
| Mozi | 针对路由器的 P2P 僵尸网络 |
| BotenaGo | 利用 30+ 漏洞 |
| custom_african_botnet | 本地开发的僵尸网络 |
数据特征(44 个原始列 + 衍生特征)
原始特征示例
- 标识: record_id(唯一标识符)
- 地理信息: target_country(20 个非洲国家)
- 攻击信息: attack_type、botnet_family、device_type、device_manufacturer、vulnerability_exploited
- 设备状态: firmware_outdated、default_credentials_used、device_has_update_mechanism、device_age_months、exposed_to_internet
- 网络安全: open_telnet、open_ssh、no_firewall、flat_network、uses_upnp
- 僵尸网络特征: part_of_botnet、botnet_size_estimate、c2_communication_encrypted、c2_uses_dga、p2p_botnet
- 攻击影响: ddos_bandwidth_gbps、ddos_type、financial_loss_usd、electricity_theft、physical_safety_risk
- 检测与响应: detected、detected_by、time_to_detect_days、device_remediated、isp_involved
- 标签: label(1 = IoT 攻击,0 = 合法流量)、is_synthetic(始终为 1)
衍生特征示例
- 设备风险评估: device_vulnerability_score、critically_exposed、default_credentials
- 僵尸网络特征: is_botnet、large_botnet、advanced_c2
- DDoS 指标: is_ddos、high_bandwidth_ddos、massive_ddos
- 影响评分: impact_score、electricity_theft、physical_safety_risk
- 检测能力: was_detected、quick_detection、undetected
- 复合评分: iot_threat_score、device_risk_score、detection_gap_score
情报来源
该数据集基于以下真实世界的威胁情报研究生成:
- NETSCOUT Threat Intelligence Report 2024
- Kaspersky IoT Threat Landscape 2024
- Nokia Threat Intelligence Report 2024
- Cloudflare DDoS Threat Report 2024
- INTERPOL Africa Cyberthreat Assessment 2025
- Spamhaus Botnet Threat Report 2024
- Trend Micro IoT Security Report 2024
- GSMA Mobile Economy Africa 2024
- Africa IoT/M2M Market Report 2024
引用格式
bibtex @misc{electricsheepafrica2026iotbotnet, title = {IoT Botnet & Smart Device Attacks (Africa)}, author = {Electric Sheep Africa}, year = {2026}, howpublished = {url{https://huggingface.co/datasets/electricsheepafrica/africa-iot-botnet-smart-device}} }
搜集汇总
数据集介绍

构建方式
该数据集以非洲大陆为背景,基于全球网络威胁情报报告(如NETSCOUT、Kaspersky、INTERPOL等)中揭示的真实攻击模式与脆弱性分布,采用合成数据生成技术构建。研究人员通过模拟非洲特有的物联网生态——包括大量未加防护的中国制造设备、默认凭据泛滥、固件更新机制缺失等现实因素,生成了10,000条平衡(正负样本各50%)的样本记录。每条样本涵盖了攻击类型、设备类型、僵尸网络家族、漏洞利用特征、网络暴露程度及检测响应等多维特征,并融入非洲各国(如南非、尼日利亚、肯尼亚、埃及)的典型攻击场景,以真实研究数据为锚点再现区域性威胁态势。
使用方法
用户可通过HuggingFace Datasets库便捷加载该数据集,仅需一行代码`from datasets import load_dataset; dataset = load_dataset("electricsheepafrica/africa-iot-botnet-smart-device")`即可获取。该数据集以表格分类任务为设计核心,适用于训练物联网入侵检测模型、构建区域化威胁态势感知系统或进行僵尸网络行为分析。研究人员可利用其丰富的特征列(如设备年龄、固件版本、默认凭据使用标志、C2通信加密状态等)进行特征工程与模型开发,同时可借助预提取的衍生特征(如device_risk_score、iot_threat_score)快速评估设备与攻击的严重性。数据集内包含明确的二分类标签(label),便于监督学习任务的展开,其合成性质也使其成为隐私敏感场景下安全共享与二次开发的理想选择。
背景与挑战
背景概述
随着物联网设备的爆炸性增长,非洲大陆正成为网络攻击的新前线。Kaspersky的威胁报告指出,在全球物联网威胁中,非洲是受攻击最严重的区域,而NETSCOUT的调研则揭露了非洲IP空间贡献了全球14%的DDoS僵尸网络流量。在此严峻背景下,Electric Sheep Africa于2026年发布了非洲物联网僵尸网络与智能设备攻击数据集。该数据集基于真实研究数据合成,建模了非洲各国面临的物联网僵尸网络招募、智能计量设备篡改及工业控制系统破坏等12类攻击场景,覆盖家庭路由器、预付费电表、太阳能逆变器及工业PLC等20余种设备类型。通过引入非洲特定的攻击模式(如M-Pesa支付终端入侵、山区采矿SCADA攻击等),该数据集为全球网络安全社区提供了稀缺的区域性威胁情报资源,推动了针对新兴市场特征的威胁检测与防御研究。
当前挑战
该数据集的核心挑战在于精确刻画非洲物联网安全的独特困境。领域层面,非洲超过7亿连接设备中充斥着廉价的中国制造设备,这些设备默认暴露Telnet/SSH端口且缺乏固件更新机制,导致Mirai变种持续感染ISP基础设施,因此数据集需要模拟设备被招募为DDoS大炮、加密货币矿工及中间人攻击节点的复杂过程。构建过程中,真实攻击数据在非洲严重匮乏——多数ISP不具备物联网威胁检测能力,且攻击行为常与合法流量高度交织——团队基于NETSCOUT、INTERPOL等多来源研究报告设计合成策略,在保持50%攻击/正常流量平衡的同时,精心构造了包含设备脆弱性评分、检测缺口指数和区域威胁标记等40余项特征,并验证了合成数据与真实攻击模式的统计一致性,从而确保数据集能有效支撑入侵检测模型的训练与评估。
常用场景
经典使用场景
在物联网安全研究领域,非洲大陆因其庞大的智能设备基数与脆弱的防护能力,成为网络威胁的高发地带。该数据集聚焦于非洲语境下的物联网僵尸网络招募与智能设备攻击,共包含10,000条合成的平衡样本,覆盖20个非洲国家的典型设备类型,如家庭路由器、预付费电表、太阳能逆变器、监控摄像头等。研究者可基于该数据集的标签特征(label),构建二分类模型以区分恶意攻击流量与正常行为,或利用攻击类型(attack_type)、僵尸网络家族(botnet_family)等细粒度标注进行多分类任务。此外,数据集提供的设备漏洞评分(device_vulnerability_score)、威胁严重性评分(iot_threat_score)等衍生特征,为评估物联网设备风险等级与检测能力缺口提供了量化基准,成为训练入侵检测系统与威胁情报分析模型的理想素材。
解决学术问题
该数据集系统性地回应了非洲物联网安全研究中数据匮乏的核心困境。学术界长期面临非洲地区物联网攻击模式不清晰、设备脆弱性数据缺失等问题,而该数据集通过整合Kaspersky、NETSCOUT等全球威胁情报,并融入地区特有攻击场景,如预付费电表操纵、太阳能逆变器僵尸网络化、M-Pesa支付终端渗透等,填补了区域安全研究的空白。数据集中刻画的检测缺口(detection_gap_score)与响应时间(time_to_detect_days)等特征,助力学者量化非洲ISP在物联网威胁监测能力上的不足,推动针对低资源环境下的轻量级入侵检测算法研究。其意义在于将非洲从全球网络安全的“盲区”转化为可分析、可建模的研究对象,为发展中国家的关键基础设施防护提供了可复用的数据基石。
实际应用
在实际安全运维中,该数据集可赋能非洲电信运营商与政府CERT团队构建定制化的威胁检测系统。基于数据集中设备制造商标识(device_manufacturer)与默认凭证使用情况(default_credentials_used)等字段,安全团队能够优先排查高风险的中国制造通用设备,降低僵尸网络感染概率。对于智能电网公司,数据集中的电表攻击模式(smart_meter_manipulation)可训练异常用电检测模型,识别盗窃行为;而针对太阳能逆变器的僵尸网络招募特征,则帮助新能源企业部署端点防护策略。此外,数据集中DDoS攻击带宽(ddos_bandwidth_gbps)与C2通信加密状态等参数,可用于仿真演练非洲网络遭受大规模DDoS攻击的场景,提升应急响应能力。金融科技企业亦可借助POS终端攻击数据,强化移动支付生态的安全基线。
数据集最近研究
最新研究方向
随着非洲大陆联网设备突破7亿台大关,该数据集精准聚焦于非洲特有的物联网僵尸网络生态与智能设备攻击范式,成为研究全球网络威胁地理差异性的关键支点。当前前沿研究正围绕Mirai变种在非洲ISP基础设施中的持久性感染机制、智能预付费电表操纵与太阳能逆变器僵尸网络征募等本土化攻击链展开,结合NETSCOUT与Kaspersky等权威报告揭示的‘非洲作为无意识DDoS炮台’现象,该数据集通过合成建模填补了非洲关键基础设施安全监测能力缺失的检测鸿沟。其重要性在于为跨国协作防御体系提供地域特异性威胁情报,推动全球物联网安全研究从泛化分析向区域精准治理演进。
以上内容由遇见数据集搜集并总结生成



