electricsheepafrica/africa-ddos-gov-telco-dataset

Name: electricsheepafrica/africa-ddos-gov-telco-dataset
Creator: electricsheepafrica
Published: 2026-05-07 16:46:40
License: 暂无描述

Hugging Face2026-05-07 更新2026-05-10 收录

下载链接：

https://hf-mirror.com/datasets/electricsheepafrica/africa-ddos-gov-telco-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是非洲网络威胁情报系列的一部分，专注于针对非洲政府和电信部门的DDoS攻击。数据集包含10,000行平衡数据（50/50），基于真实世界的研究数据（非合成）。特征包括各种网络流指标、攻击特征和目标信息。数据集适用于表格分类任务。

This dataset is a component of the African Cyber Threat Intelligence series, focusing on DDoS attacks targeting government and telecommunications sectors in Africa. It consists of 10,000 rows of balanced data with a 50/50 class distribution, sourced from real-world research data (non-synthetic). Features include various network flow metrics, attack signatures, and target information. This dataset is suitable for tabular classification tasks.

提供机构：

electricsheepafrica

搜集汇总

数据集介绍

构建方式

该数据集隶属于Africa Cyber Threat Intelligence项目，由Electric Sheep Africa基于真实研究数据构建而成。数据集包含10,000条记录，其中攻击样本与正常流量样本以50:50的比例平衡分布，且所有数据均标记为非合成样本（is_synthetic=0），确保了数据的真实性与可靠性。每条记录以网络流为基本单元，涵盖从基础五元组（源/目的IP与端口、协议）到高级流量统计特征（如数据包速率、字节速率、流间隔时间等）的丰富字段，并引入了综合性的风险评分指标（如ddos_risk_score），为多维度分析DDoS攻击提供了坚实的数据基础。

特点

数据集核心特色在于其针对非洲地区政府与电信行业DDoS攻击的深度聚焦。特征设计不仅包含传统的网络流属性（如标志位计数、数据包大小分布），还特别引入了区域感知特征，例如目标是否为非洲IP（is_african_dst）、是否隶属于政府或电信关键基础设施（target_sector_gov、target_sector_telco），以及与攻击类型（如容量型、协议型、应用层攻击）高度相关的衍生指标。此外，数据集中提供了多种二值标示字段（如is_volumetric、is_amplification），便于研究者快速筛选特定攻击模式，体现了对现实世界中非洲网络威胁场景的精准刻画。

使用方法

该数据集可直接通过HuggingFace Datasets库加载，使用代码`load_dataset("electricsheepafrica/africa-ddos-gov-telco-dataset")`即可获取。数据以表格分类任务（tabular-classification）形式组织，适用于监督学习场景下的DDoS攻击检测与分类模型训练。由于所有字段均为预处理后的数值或类别型特征，研究者可直接将其输入机器学习或深度学习框架进行特征工程与建模。建议在使用前利用平衡的标签分布（label列）进行交叉验证，同时可结合地域与行业标签（target_country、target_sector）开展针对非洲网络环境的细粒度分析。

背景与挑战

背景概述

该数据集名为africa-ddos-gov-telco-dataset，由Electric Sheep Africa机构于2026年创建，聚焦于非洲地区政府与电信部门面临的分布式拒绝服务（DDoS）攻击威胁。在全球数字化转型浪潮中，非洲大陆的关键基础设施日益成为网络攻击的焦点，而针对政府与电信行业的DDoS攻击尤具破坏性，可能导致公共服务瘫痪与通信中断。该数据集基于真实世界研究数据合成了10,000条平衡样本，旨在填补非洲地区DDoS攻击领域标准化、结构化数据集的空白，为网络威胁智能分析提供基础，推动针对性的攻击检测与防御策略研究。其发布对非洲乃至全球的网络安全社区具有重要价值，促使学界与业界更深入地关注该区域的独特攻击模式与特征。

当前挑战

该数据集所解决的领域问题核心在于非洲政府与电信领域DDoS攻击的检测与分类。挑战包括：一方面，现有网络流量数据集多源自欧美环境，缺乏对非洲网络基础设施特征、协议分布及攻击模式的覆盖，导致区域化安全模型泛化能力不足；另一方面，真实攻击数据的敏感性与稀缺性使得数据采集困难，研究人员不得不依赖合成数据或模拟攻击，这可能引入偏倚。在构建过程中，需确保合成样本的高保真度，平衡50/50的正负样本比例以避免类别不均衡，同时设计涵盖80余项特征（如流量时序、标志位、包速率、目标国别与行业标识等）以满足多层次分类需求，并严格标注非合成来源以维护数据真实性，这些均构成显著的工程与学术挑战。

常用场景

经典使用场景

在非洲网络安全领域，分布式拒绝服务（DDoS）攻击对政府和电信行业的威胁尤为严峻。该数据集专为分类任务设计，特别适用于基于网络流特征的DDoS攻击检测模型的训练与评估。研究人员可利用其中丰富的流量统计特征（如数据包速率、往返比例、标志位分布等）与衍生指标，构建高效的二分类或多分类模型，精准区分恶意攻击流量与正常业务流量。其平衡分布（50/50正负样本）为模型提供了稳健的基准确立条件，尤其在非洲主客体IP标注的支持下，有助于探索区域化攻击模式的识别能力。

衍生相关工作

围绕该数据集，可衍生出一系列深层次的研究工作。例如，利用其特征工程中的89维流量向量，可以开发轻量化网络入侵检测模型，探索特征选择与攻击检测准确率之间的最佳平衡；针对其标注的易受攻击端口与服务（如DNS、SSH、Web），可开展服务级安全态势评估研究；结合攻击聚合类标签（如容积攻击、协议攻击、应用层攻击），可构建多标签分类模型；此外，基于该数据集衍生指向非洲子区域的DDoS攻击数据集家族，亦可能催生针对低资源环境下的迁移学习与联邦学习防御架构研究。

数据集最近研究