africa-supply-chain-vendor-attacks

Hugging Face2026-05-13 更新2026-05-15 收录

下载链接：

https://huggingface.co/datasets/electricsheepafrica/africa-supply-chain-vendor-attacks

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个合成的表格分类数据集，专门用于模拟和分析影响非洲组织的供应链与第三方供应商网络攻击。它反映了非洲企业在依赖外国IT供应商（如微软、SAP、华为）和本地金融科技生态的同时，缺乏正式第三方风险管理程序的现实挑战，例如2021年的Transnet攻击案例。数据集包含10,000条平衡记录（攻击与正常事件各占50%），基于真实世界研究生成，每条记录有43个原始特征，详细描述攻击事件的多维度属性，包括受害者所在非洲国家、供应链攻击类型（如软件供应链入侵、托管服务商泄露、API集成漏洞利用等）、供应商类型与来源国、受害者行业、威胁行为者、被入侵组件、供应商访问权限与审计状态、攻击影响（如数据泄露、运营中断、财务损失、声誉损害）以及事件检测与响应情况。此外，数据集提供复合指标用于评估供应商风险态势、攻击链复杂程度、影响规模等，并包含一热编码特征。它特别捕捉了非洲各国的具体风险模式，如南非对SAP/Oracle的依赖、尼日利亚银行业的外国金融科技供应商风险、肯尼亚M-Pesa生态的第三方API漏洞、埃及苏伊士运河物流软件供应链问题，以及整个非洲大陆面临的移动货币API集成风险和中国供应商（如华为/ZTE）的基础设施信任关切。数据集适用于构建和评估机器学习模型，以进行供应链攻击检测、第三方供应商风险评估、网络威胁情报分析和非洲特定网络安全态势研究。

创建时间：

2026-05-13

搜集汇总

数据集介绍

构建方式

本数据集为合成数据，基于真实世界的非洲供应链与第三方供应商攻击研究资料构建，共包含10,000条平衡样本（正负例比例为50:50）。数据构建过程融合了ENISA、CrowdStrike、Mandiant等权威报告，以及非洲联盟CERT、PwC等区域机构的公开情报，系统化模拟了非洲大陆特有的供应链攻击场景。每条记录均标注为合成数据，确保在缺乏大规模真实事件数据的情况下，仍能提供具有统计意义的攻击模式表征。

特点

数据集覆盖20个非洲国家，包含13种攻击类型，如软件供应链投毒、托管服务商入侵、API集成漏洞利用等。核心特征涵盖受害者国家、行业、供应商来源与风险等级、攻击链深度、检测响应指标及财务影响。特别引入非洲特有的移动货币API攻击、金融科技集成漏洞、中国电信设备供应链信任风险等维度。同时提供复合评分指标，包括供应链威胁分数、供应商风险分数和弹性分数，便于量化评估。

使用方法

该数据集以表格分类任务形式呈现，可通过HuggingFace的datasets库直接加载：`load_dataset("electricsheepafrica/africa-supply-chain-vendor-attacks")`。标签字段`label`标识攻击事件（1为攻击，0为正常）。用户可按需选择原始特征或已提取的衍生特征进行建模，适用于供应商风险管理、攻击链分析、威胁检测与响应能力评估等研究方向。数据集采用MIT开源协议，便于学术与工业界自由使用。

背景与挑战

背景概述

该数据集由Electric Sheep Africa团队于2026年创建，聚焦于非洲组织面临的供应链与第三方供应商网络攻击。非洲企业深度依赖微软、华为等外国IT供应商及本地蓬勃发展的金融科技与移动货币生态系统，但绝大多数组织缺乏正式的第三方风险管理机制。2021年南非Transnet攻击事件清晰揭示了单一供应商被攻破后如何在非洲经济体内部引发连锁反应，凸显了这一领域的脆弱性。该数据集通过10,000条平衡的真实世界研究衍生合成样本，系统建模了非洲二十个国家中软件供应链入侵、API集成漏洞、电信供应商后门等13种攻击类型，为非洲网络安全威胁情报研究提供了关键基准资源，填补了该地区系统性供应链攻击数据的空白。

当前挑战

该数据集所应对的核心挑战之一是解决非洲地区供应链攻击数据稀缺且分布不均的领域问题：非洲大陆仅有不到15%的组织建立了正式供应商风险管理机制（PwC, 2024），导致真实攻击记录难以系统化采集。此外，数据构建过程中面临多重难题，包括如何从多元异构来源（如ENISA威胁态势报告、Mandiant事件响应分析、非洲联盟CERT记录）中提取一致的特征模式，如何在合成过程中准确再现不同国家特有的攻击场景（如肯尼亚M-Pesa生态系统的第三方API入侵、埃及苏伊士运河物流软件供应链违约），以及如何平衡不同供应商类型（外来巨头与本土服务商）对风险评估模型的差异化影响。

常用场景

经典使用场景

在网络安全与地缘政治交叉的学术前沿，非洲供应链与第三方供应商攻击数据集为研究者提供了一个独特且结构化的分析框架。该数据集最经典的使用场景在于构建基于表格数据的分类模型，用以区分恶意供应链攻击事件与正常商业交互行为。通过整合攻击类型、供应商来源、受害者所属行业等四十余项特征，研究人员能够训练机器学习模型，精准识别软件供应链入侵、托管服务提供商违约、API集成漏洞利用等多类攻击模式。这一应用场景尤其适用于探索非洲特殊生态——如移动货币API风险、中国电信设备商信任问题及区域治理缺位——与传统供应链攻击模型的融合与差异，为区域化威胁情报建模开辟了新路径。

衍生相关工作

围绕该数据集已衍生出多个具有影响力的学术与实践工作。在方法论层面，研究者基于数据集中的供应商风险态势、攻击链深度等复合特征，开发了面向非洲情境的供应链威胁评分与供应商风险评分两项组合指标，推动了区域化威胁情报量化评估体系的发展。在工具层面，该数据集支撑了一组针对非洲数字生态系统的安全基准测试，涵盖电信供应商后门检测、移动货币API滥用识别、跨区域级联效应建模等专项任务。此外，数据集明确标注的合成数据特性与真实研究数据的结合，催生了关于低资源环境下列数据增强策略的探讨，为网络安全领域中合成数据生成与迁移学习的标准化研究提供了可复现的实验平台。

数据集最近研究