africa-ransomware-as-a-service
收藏Hugging Face2026-05-13 更新2026-05-15 收录
下载链接:
https://huggingface.co/datasets/electricsheepafrica/africa-ransomware-as-a-service
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个合成的表格分类数据集,专注于模拟针对非洲组织的勒索软件即服务(RaaS)攻击,属于非洲网络威胁情报系列的一部分。它旨在反映非洲作为新勒索软件变种全球部署前测试场的独特动态,原因包括当地安全态势较低、执法响应较弱以及攻击者采取以量取胜的策略。数据集包含10,000条平衡记录(50%攻击,50%正常),所有数据均为基于真实世界研究报告生成的合成数据。数据内容涵盖了20个非洲国家,模拟了包括LockBit 3.0、ALPHV/BlackCat、Akira等在内的10个主要RaaS家族的攻击活动,以及网络钓鱼、漏洞利用、RDP暴力破解等7种初始访问向量。数据集提供了55个特征字段,详细描述了攻击事件的技术细节(如驻留时间、横向移动、权限提升)、影响后果(如财务损失、数据泄露、服务中断)、组织响应(如事件响应、执法联系)和恢复情况(如备份有效性、恢复时间)。此外,还提取了多个复合特征,如攻击深度分数、勒索级别、测试场分数、非洲利用分数等,用于量化攻击的复杂性和地域特异性。该数据集适用于网络安全领域的威胁情报分析、勒索软件攻击检测与分类模型训练、以及针对非洲地区网络安全风险的研究。
This dataset is a synthetic tabular classification dataset focused on simulating ransomware-as-a-Service (RaaS) attacks targeting African organizations, and is part of the African Cyber Threat Intelligence series. It aims to reflect the unique dynamics of Africa acting as a testbed for new ransomware variants prior to their global deployment, driven by factors including weak local security posture, limited law enforcement response, and attackers' quantity-over-quality tactics. The dataset contains 10,000 balanced records (50% attack cases, 50% benign cases), with all data generated synthetically based on real-world research reports. It covers 20 African countries, simulating attack activities from 10 major RaaS families including LockBit 3.0, ALPHV/BlackCat, Akira, and others, as well as 7 initial access vectors such as phishing, exploit attacks, and RDP brute-force attacks. The dataset provides 55 feature fields detailing technical specifics of attack incidents (e.g., dwell time, lateral movement, privilege escalation), impact consequences (e.g., financial loss, data breach, service disruption), organizational responses (e.g., incident response, law enforcement liaison), and recovery status (e.g., backup effectiveness, recovery time). Additionally, multiple composite features are extracted, such as attack depth score, ransomware severity level, testbed score, African exploitation score, etc., to quantify attack complexity and geographic specificity. This dataset is suitable for threat intelligence analysis in the cybersecurity domain, training of ransomware attack detection and classification models, and research on cybersecurity risks in the African region.
创建时间:
2026-05-13
搜集汇总
数据集介绍

构建方式
本数据集为合成数据,基于Sophos、Kaspersky、Check Point等九家权威安全机构2024年至2025年间发布的非洲勒索软件态势调研报告构建而成。通过模拟真实世界中针对非洲组织的勒索软件即服务(RaaS)攻击场景,生成了10000条平衡样本,正负类别各占50%。每条记录囊括了攻击向量、勒索家族、支付方式、检测响应及财务影响等50余个特征维度,确保数据既具有学术研究的可复现性,又贴近现实威胁的复杂性。
特点
该数据集的核心亮点在于精准刻画了非洲作为RaaS新型变种试验场的独特威胁生态。其特有的特征工程涵盖非洲溢价调整后的勒索金额区间(5000至50000美元)、移动货币至加密货币的赎金支付桥接模式、低技能本地关联方招募机制,以及关键基础设施与移动支付生态的破坏评估。此外,数据集中还预置了包括攻击深度评分、非洲剥削指数、测试场评分在内的十余项复合特征,为深入研究区域化勒索软件行为模式提供了罕见的量化工具。
使用方法
用户可通过HuggingFace的`datasets`库直接加载使用,命令为`load_dataset("electricsheepafrica/africa-ransomware-as-a-service")`。该数据集设计为表格分类任务,特别适用于训练和评估针对非洲地区RaaS攻击的检测模型、威胁情报归因系统以及勒索金额预测算法。数据集中已提供`label`列作为二分类监督信号,并附有`is_synthetic`标识字段以明确数据来源属性,便于研究者在合成数据与真实场景之间进行迁移学习或多任务训练。
背景与挑战
背景概述
随着勒索软件即服务(RaaS)模式的全球蔓延,非洲大陆正沦为新型勒索软件变种的首选试验场。由Electric Sheep Africa机构于2026年创建的该数据集,聚焦于RaaS操作针对非洲组织的攻击行为,涵盖南非、尼日利亚、肯尼亚及埃及等20个国家。依托Sophos、卡巴斯基、Check Point等权威机构的2024至2025年研究报告,该数据集以10,000条合成记录(类别均衡)模拟了LockBit 3.0、ALPHV BlackCat等主流RaaS家族的攻击特征,以及非洲特有的低赎金经济、移动支付赎金桥梁和薄弱防御体系。其核心研究问题在于揭示非洲作为全球勒索软件测试温床的机理,为区域化网络威胁情报建模提供了开创性基准。
当前挑战
该数据集面临的挑战核心在于三重失衡:首先,领域层面需解决非洲组织恢复能力极度匮乏的痛点——仅不到10%的企业具备成文事件响应预案,低于30%拥有可用备份,导致勒索攻击的破坏性被显著放大。其次,构建过程中遭遇数据稀疏性难题,真实非洲RaaS攻击案例的公开记录有限,迫使研究者依赖极少样本进行合成生成,可能引入地域偏差。再者,RaaS变种快速迭代与非洲特有的低赎金经济动态形成非对称对抗,新增特征如移动支付赎金通道(mobile_money_bridge)和本地基础设施利用(uses_local_infrastructure)缺乏标准化对比基准,增加了模型泛化评估的复杂性。
常用场景
经典使用场景
在网络安全研究领域,该数据集专注于非洲大陆特有的勒索软件即服务(RaaS)生态建模。它捕捉了非洲作为新型勒索软件变种‘试验场’的动态特征,涵盖20个非洲国家的真实攻击模式,包括南非、尼日利亚、肯尼亚等关键目标。数据集包含10,000条平衡样本,详细记录了攻击者从初始入侵(如钓鱼邮件、RDP暴力破解)到数据加密、双重或三重勒索的全链路行为,并融入了非洲特有的移动货币赎金支付、低赎金经济学及薄弱防御态势等地域性维度。研究者可据此构建分类模型,区分RaaS攻击与合法流量,或训练入侵检测系统以预警新型勒索软件变种。
解决学术问题
该数据集直面非洲网络安全研究的结构性困境——非洲勒索软件攻击数据极度匮乏,现有研究多依赖欧美样本,忽视非洲作为‘试验场’的独特威胁传播机制。它解决了量化评估非洲组织防御脆弱性的难题,如仅10%的机构具备经过测试的事件响应计划,以及移动货币支付链路为攻击者提供的新型洗钱渠道。数据集通过合成技术(基于Sophos、Check Point等权威报告)弥合了真实数据缺口,使学者能够首次系统地建模‘低赎金-高频率’的攻击策略、本土附属招募模式,以及新变种在非洲先导部署后向全球扩散的传播动力学,为勒索软件生命周期理论提供了关键的非洲实证基础。
衍生相关工作
该数据集衍生了一系列前沿研究脉络,催生了多项标志性工作。基于其特征工程的‘攻击深度评分’与‘非洲剥削指数’,研究者构建了针对新兴市场的勒索软件威胁量化评估框架,如《Africa RaaS Observatory》(2025)发布的年度威胁报告。数据驱动的‘赎金谈判动力学模型’揭示了非洲场景下5K−50K美元博弈对攻击者决策的影响,相关成果发表于《Computers & Security》。‘移动货币桥接支付分析’分支催生了暗网加密货币流追踪工具,被Chainalysis等机构采纳。此外,‘附属招募低技能化’特征推动了社工防御训练数据集构建,衍生出如‘Telegram勒索者行为模式’基准测试。这些工作共同将非洲从网络安全研究的边缘地带提升至全球勒索软件生态链的关键枢纽认知。
以上内容由遇见数据集搜集并总结生成



