five

africa-mobile-ransomware

收藏
Hugging Face2026-05-15 更新2026-05-16 收录
下载链接:
https://huggingface.co/datasets/electricsheepafrica/africa-mobile-ransomware
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个合成的表格分类数据集,专注于模拟和分析针对非洲移动设备用户和企业的勒索软件攻击。非洲是一个移动优先的大陆,拥有6.15亿移动用户,智能手机普及迅速,但移动安全意识和补丁部署水平显著落后于全球标准。随着移动银行、移动货币钱包和商业运营日益依赖安卓设备,移动勒索软件成为一个高影响力的威胁载体。数据集旨在捕捉非洲特有的攻击模式,包括:以中国品牌安卓手机为主的设备生态,安全补丁延迟或缺失;通过WhatsApp群组、恶意Telegram频道等途径进行侧载APK的攻击向量;针对移动货币代理、M-Pesa/OPay钱包加密等独特目标;以及依赖移动银行的个体经营者、微企业等受害者画像。数据集规模为10,000行,正负样本平衡(50/50)。所有记录均为基于真实世界研究数据生成的合成数据。数据集包含丰富的特征列,涵盖记录标识、地理位置、勒索软件家族、攻击向量、目标应用类型、设备信息、勒索要求、加密破坏范围、设备锁定状态、凭证窃取、多重勒索威胁、受害者画像、设备安全状态、攻击后果、检测与响应措施等,以及最终的二元分类标签。此外,还包括从原始特征中提取的复合特征,如加密总分、持久性分数等。该数据集适用于网络安全领域的表格分类任务,特别是用于训练和评估移动勒索软件检测模型、进行威胁情报分析以及研究非洲特定的移动安全威胁态势。

This dataset is a synthetic tabular classification dataset focused on simulating and analyzing ransomware attacks targeting mobile device users and businesses in Africa. Africa is a mobile-first continent with 615 million mobile users, rapid smartphone adoption, but mobile security awareness and patch deployment levels significantly lag behind global standards. As mobile banking, mobile money wallets, and business operations increasingly rely on Android devices, mobile ransomware becomes a high-impact threat vector. The dataset aims to capture Africa-specific attack patterns, including: a device ecosystem dominated by Chinese-brand Android phones with delayed or missing security patches; attack vectors via sideloaded APKs through WhatsApp groups, malicious Telegram channels, fake mobile money apps, and infected ad networks; unique targets such as mobile money agents, M-Pesa/OPay wallet encryption combined with USSD hijacking; and victim profiles including individual entrepreneurs, micro-enterprises, journalists, and HR professionals dependent on mobile banking. The dataset size is 10,000 rows with balanced positive and negative samples (50/50). All records are synthetic data generated based on real-world research data. It includes rich feature columns covering record identifiers, geographic locations (20 African countries), ransomware families (29 families), attack vectors (15 types), target application types, device information (Android version, brand, mobile network), ransom demands, encryption damage scope, device lock status, credential theft, multiple extortion threats, victim profiles, device security status, attack consequences, detection and response measures, and a binary classification label. Additionally, composite features extracted from original features, such as encryption total score, persistence score, credential theft total score, extortion complexity score, and security posture score, are included. This dataset is suitable for tabular classification tasks in cybersecurity, particularly for training and evaluating mobile ransomware detection models, conducting threat intelligence analysis, and studying Africa-specific mobile security threat landscapes.
创建时间:
2026-05-13
原始信息汇总

数据集概述:Mobile Ransomware (Africa)

基本信息

  • 数据集名称: Mobile Ransomware (Africa)
  • 数据来源: 合成数据(Synthetic),基于真实研究数据生成
  • 数据规模: 10,000 条记录,正负样本平衡(50/50)
  • 许可证: MIT
  • 任务类型: 表格分类(Tabular Classification)
  • 标签: 网络安全、非洲、分类、勒索软件、移动安全、Android、移动货币、恶意软件

数据集背景

该数据集模拟针对非洲移动设备用户和企业的移动勒索软件攻击。非洲是全球移动优先的大陆,拥有6.15亿移动用户,但移动安全意识和补丁部署远远落后于全球标准。随着移动银行、移动货币钱包和业务运营越来越依赖Android设备,移动勒索软件成为高风险威胁向量。

非洲特有模式

  • 设备生态: 中国品牌Android手机(Tecno、Infinix、Itel)占据50%以上市场份额,安全补丁延迟或缺失
  • 攻击向量: 通过WhatsApp群组侧载APK、恶意Telegram频道、虚假移动货币应用、被攻陷的广告网络
  • 独特目标: 使用共享设备的移动货币代理、M-Pesa/OPay钱包加密、USSD劫持结合勒索软件
  • 受害者画像: 依赖移动银行的个体商户和微型企业、移动货币代理、记者、人力资源专业人员
  • 勒索方式: 通讯录威胁(利用非洲社群社交网络)、社交媒体羞辱、虚假执法信息
  • 支付方式: 移动货币转账、话费充值、加密货币混币、礼品卡
  • 安全状况: 启用未知来源、侧载应用、盗版软件、禁用OEM更新、无杀毒软件
  • 碎片化: Android 4.4–14,定制ROM,从未接收安全更新的设备

勒索软件家族

共包含27个勒索软件家族,涵盖文件加密、屏幕锁定、银行木马、短信窃取等多种类型:

  • 典型加密勒索软件: CryCryptor, Simplocker, LockerPin
  • 冒充执法机关: Koler, Fusob
  • 银行木马+勒索: Svpeng, Cerberus, Anubis, Medusa, Hydra, Teabot
  • 非洲特定变种: MpendaLocker(针对移动货币)、M-ShwariEncryptor(M-Shwari银行)、OPayStealer_Ransom(OPay钱包)、WhatsAppBizLocker(WhatsApp Business)、USSDHijack_Ransom(USSD劫持)、AfricanAndroidBanker_Ransom(非洲银行木马)
  • 间谍软件+勒索混合: Pegasus_mobile_ransom
  • 其他: SideloadEncryptor(侧载向量)、AgentSmith_ransom_variant(广告欺诈+勒索)

攻击向量

共15种攻击向量,包括:

  • 恶意应用商店、WhatsApp侧载APK、短信钓鱼链接、WhatsApp恶意链接、Telegram频道APK分发
  • 虚假更新通知、被攻陷广告网络、USB侧载、蓝牙文件传输、附近共享漏洞
  • 虚假移动货币应用、恶意二维码、社交工程电话、路过式下载、供应链应用攻陷

数据特征

数据集包含丰富特征,覆盖攻击细节、设备安全状态、受害者画像、影响评估等维度:

主要特征类别

类别 描述
基础信息 record_id, country(20个非洲国家), ransomware_family, attack_vector, target_app_type, android_version, device_brand, mobile_network
勒索信息 ransom_demand_category, ransom_demand_usd, payment_method
加密范围 encrypted_files_count, contacts_encrypted, photos_encrypted, messages_encrypted, app_data_encrypted, sd_card_encrypted, cloud_backup_encrypted
设备锁定 device_locked_screen, pin_changed, factory_reset_blocked, safe_mode_blocked
权限滥用 accessibility_service_abuse, overlay_attack, keylogger_active
凭证盗取 credential_harvesting, banking_credential_stolen, mobile_money_pin_stolen, cryptocurrency_seed_stolen, two_factor_codes_intercepted
勒索策略 double_extortion, triple_extortion, ddos_threat, contact_list_threat, social_media_shaming_threat, fake_law_enforcement_message, fake_antivirus_ransom
受害者画像 is_business, is_individual, business_size, is_mobile_money_agent, is_business_owner, is_government_employee, is_journalist, is_hr_professional
设备安全 google_play_protect_enabled, third_party_av_installed, device_rooted, oem_updates_disabled, unknown_sources_enabled, security_patch_over_1_year, sideloaded_apps_present, pirated_app_installed, usb_debugging_enabled
影响评估 financial_loss_total, business_interruption_hours, reputational_damage, customer_data_lost, regulatory_report_required
检测响应 detected, time_to_detect_hours, detected_by, ransomware_removed, data_restored_from_backup, device_factory_reset, police_report_filed
标签 label(1=攻击,0=合法),is_synthetic

提取的复合特征

  • 加密范围: total_encryption_score, deep_encryption, full_device_encryption
  • 持久性: persistence_score, aggressive_persistence, screen_lock_ransom
  • 凭证盗取: financial_credential_theft, multi_factor_bypass, total_credential_theft
  • 勒索复杂度: extortion_sophistication_score, advanced_extortion, psychological_pressure
  • 设备安全: security_posture_score, vulnerability_score, highly_vulnerable
  • 受害者画像: high_value_target, business_target, mass_infection
  • 家族、向量、目标应用one-hot编码: 29个家族、15个向量、12个目标应用
  • 设备与区域标志: brand_transsion, android_old, is_west_africa, high_mobile_money_country
  • 支付方式: payment_crypto, payment_mobile_money
  • 综合评分: mobile_ransomware_threat_score, mobile_vulnerability_score, mobile_response_effectiveness

数据来源

该合成数据集的真实研究基础来源于:

  1. Kaspersky Mobile Malware Report 2024
  2. Check Point Mobile Security Report 2024
  3. ESET Threat Report 2024 — Android ransomware
  4. Sophos State of Ransomware 2024
  5. INTERPOL Africa Cyberthreat Assessment 2025
  6. GSMA Mobile Economy Africa 2024
  7. Malwarebytes Mobile Threat Report 2024
  8. World Bank Digital Development Africa

使用示例

python from datasets import load_dataset dataset = load_dataset("electricsheepafrica/africa-mobile-ransomware")

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集由Electric Sheep Africa团队基于真实的非洲移动勒索软件威胁情报研究而合成构建。数据采集融合了Kaspersky、Check Point、ESET、Sophos、INTERPOL及GSMA等权威机构2024至2025年的多份安全报告,并针对非洲移动优先的独特生态,模拟了包括Tecno、Infinix等中国品牌安卓设备、第三方应用商店侧载、WhatsApp与Telegram恶意APK分发、虚假移动支付应用等攻击场景。共计生成10,000条平衡样本(正负例各占50%),每条记录均标注为合成数据(is_synthetic=1),涵盖20个非洲国家、29个勒索软件家族及15种攻击向量。
特点
该数据集的核心特色在于对非洲移动勒索攻击的深度情境化建模。除传统文件加密、屏幕锁定等指标外,创新性地纳入了移动货币PIN窃取、USSD劫持、联系人列表威胁、社交媒体羞辱勒索等非洲特有的攻击手段。数据包含超过80个特征维度,覆盖设备安全状态、受害者画像、赎金支付方式(移动货币、话费充值、加密货币)、双重/三重勒索标志以及攻击检测与响应效果评估。特别设计了面向移动货币代理、小企业主、记者等高风险人群的细分标签,并提取了加密深度、持久化强度、凭证窃取等复合特征,便于精细化分析。
使用方法
用户可通过HuggingFace Datasets库一键加载该数据集,Python代码为:`from datasets import load_dataset; dataset = load_dataset('electricsheepafrica/africa-mobile-ransomware')`。适用于表格分类任务,典型应用包括勒索软件攻击检测、威胁等级评估、受害者风险画像及攻击向量溯源。数据已提供预处理的特征工程结果,如设备漏洞评分、勒索威胁综合指数等,可直接用于机器学习模型训练。建议在模型开发时关注‘label’列作为预测目标,并利用‘is_business’、‘is_mobile_money_agent’等列进行分组分析,以适配非洲移动安全领域的差异化防御策略研究。
背景与挑战
背景概述
随着非洲大陆移动优先的数字化进程加速,615百万移动用户和日益普及的智能手机使得移动端勒索软件成为新兴的严重安全威胁。2026年,由Electric Sheep Africa团队创建的africa-mobile-ransomware数据集应运而生,聚焦于针对非洲移动设备和用户的勒索攻击。该数据集以真实研究数据为基础,通过合成10,000条平衡样本,深入刻画了非洲特有的攻击生态:传音等中国品牌Android设备占据超半数市场份额且安全补丁滞后,攻击向量涵盖WhatsApp侧载APK、假冒移动货币应用及USSD劫持等,受害群体包括移动货币代理、个体商户及记者等依赖移动银行的关键人群。作为非洲网络威胁情报体系的核心组件,该数据集为理解和应对区域特异性勒索攻击提供了基准资源。
当前挑战
该数据集所解决的领域挑战在于非洲移动安全生态的独特性:传统安全模型难以适配Android版本碎片化严重、设备长期无补丁更新、用户偏好侧载与盗版应用的环境,且勒索手段融合了社区敲诈、社交媒体羞辱与假执法消息等社会工程策略。构建过程中,挑战则在于真实攻击数据的稀缺性与敏感性——非洲网络安全基础设施薄弱,公开入侵事件记录有限,评估报告多来自国际安全厂商而非本地来源;为此,研究团队需基于Kaspersky、Interpol等多源情报提炼攻击模式,再通过合成技术平衡样本类别并编码设备品牌、安全配置、加密范围等67维特征,确保在缺乏直接观测数据的前提下仍能真实反映非洲勒索攻击的复杂面貌。
常用场景
经典使用场景
在移动安全与网络威胁情报研究领域,africa-mobile-ransomware数据集为研究者提供了针对非洲地区移动勒索软件攻击的精细化建模与分类基准。该数据集涵盖20个非洲国家、29种勒索软件家族及15种攻击向量,特别聚焦于Tecno、Infinix等本地主流设备生态以及M-Pesa、OPay等移动货币平台的攻击手法。其经典使用场景包括基于表格数据的勒索软件家族识别、攻击向量溯源、受害者画像构建,以及区域安全态势评估,为非洲移动优先环境下的威胁检测模型训练与防御策略验证提供了高质量合成数据支撑。
实际应用
在实际应用层面,该数据集可直接服务于非洲地区移动银行、移动货币代理网络以及中小型企业的安全防护体系构建。安全团队可利用其中的攻击向量分布、支付方式偏好以及受害者行为模式,设计针对性的用户教育方案与威胁预警机制。例如,通过分析'侧载APK经由WhatsApp分发'这一高频向量,可指导移动安全应用开发者优化恶意软件扫描策略。同时,数据集中的业务中断时长、财务损失统计等字段,为保险公司定制勒索软件风险定价模型提供了参考依据,助力区域数字金融生态的韧性建设。
衍生相关工作
围绕africa-mobile-ransomware数据集,研究者已衍生出多项经典工作,包括基于特征工程的勒索软件早期检测分类器、面向非洲移动货币场景的多阶段攻击链重建框架,以及融合设备补丁状态与用户行为的脆弱性评估模型。部分工作将该数据集与全球勒索软件数据库对比,验证了地域性特征对检测性能的提升作用。此外,数据集的双重勒索与三重勒索标签催生了关于非洲社交网络威胁(如联系人列表恐吓)的量化分析研究,相关成果已被收录至区域网络安全态势报告中,成为连接合成数据与现实威胁情报的桥梁。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作