africa-ussd-session-hijack

Hugging Face2026-05-13 更新2026-05-15 收录

下载链接：

https://huggingface.co/datasets/electricsheepafrica/africa-ussd-session-hijack

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个合成的表格分类数据集，专门用于建模和分析针对非洲移动货币平台的USSD（非结构化补充业务数据）会话劫持与操纵攻击。USSD是非洲移动金融服务（处理全球74%的移动货币交易）的支柱技术，因其基于GSM信令通道且无需数据连接，在普及的同时也面临独特的安全漏洞。数据集包含10,000条平衡记录（50%攻击，50%正常），所有数据均为基于真实世界研究报告参数生成的合成数据。数据涵盖了八种主要的攻击向量，包括会话劫持、代码注入、重放攻击、中间人攻击、USSD欺骗、SIM工具包操纵、会话终止和USSD泛洪。数据特征丰富，包括原始字段（如国家、移动货币平台、攻击类型、会话参数、受害者人口统计信息、交易金额、各种异常标志以及攻击标签）和大量从原始数据中提取的衍生特征（如会话异常分数、网络异常指标、受害者风险评分、攻击类型和平台的一键编码、区域标志以及复合风险与检测分数）。该数据集适用于网络安全威胁检测、异常检测、欺诈预防模型训练以及非洲特定金融科技安全研究等任务。

This dataset is a synthetic tabular classification dataset specifically designed for modeling and analyzing USSD (Unstructured Supplementary Service Data) session hijacking and manipulation attacks targeting African mobile money platforms. USSD is a backbone technology for African mobile financial services (handling 74% of global mobile money transactions), and due to its reliance on GSM signaling channels without requiring data connectivity, it faces unique security vulnerabilities while being widely adopted. The dataset contains 10,000 balanced records (50% attacks, 50% normal), all generated as synthetic data based on real-world research report parameters. It covers eight major attack vectors, including session hijacking, code injection, replay attacks, man-in-the-middle attacks, USSD spoofing, SIM toolkit manipulation, session termination, and USSD flooding. The data features are rich, including raw fields (such as country, mobile money platform, attack type, session parameters, victim demographics, transaction amounts, various anomaly flags, and attack labels) and numerous derived features extracted from the raw data (such as session anomaly scores, network anomaly indicators, victim risk scores, one-hot encoding of attack types and platforms, regional flags, and composite risk and detection scores). This dataset is suitable for tasks like cybersecurity threat detection, anomaly detection, fraud prevention model training, and Africa-specific fintech security research.

创建时间：

2026-05-12

搜集汇总

数据集介绍

构建方式

该数据集基于真实世界的研究数据，通过合成方法构建，共计包含10,000条记录，正负样本均衡分布。构建过程严格参考了GSMA移动货币年度报告、尼日利亚中央银行支付系统报告、CybCube非洲网络风险报告、世界金融非洲移动货币威胁分析以及国际刑警组织非洲网络威胁评估等权威文献，确保了数据参数的科学性与真实性。每一条记录均标记为合成数据，覆盖了非洲主要移动货币平台与电信运营商，反映了USSD会话劫持与操纵攻击的复杂生态。

特点

数据集具备丰富的特征维度，涵盖攻击类型、会话行为、网络信号、设备身份、用户画像及财务影响等多个层面。核心特征包括会话时长异常、菜单导航异常、响应延迟变化、IMEI/IMSI变更、基站欺骗及信号强度异常等，并在此基础上衍生出会话异常评分、网络异常评分、受害者脆弱性评分与检测效果评分等复合指标。攻击类型覆盖会话劫持、代码注入、重放攻击、中间人攻击、USSD欺骗、SIM工具包操纵、会话终止及USSD洪水攻击等八种典型威胁场景。

使用方法

用户可通过HuggingFace Datasets库直接加载该数据集，使用`load_dataset("electricsheepafrica/africa-ussd-session-hijack")`一行命令即可获取。数据集以表格分类任务形式提供，适用于训练和评估USSD会话攻击检测模型。建议将`label`字段作为分类目标，利用会话异常特征、网络异常特征、用户画像特征及区域标识等作为输入，构建二分类或多分类模型。研究者可进一步基于提取特征进行特征工程优化，或结合时序信息开发实时入侵检测系统。

背景与挑战

背景概述

在非洲，移动货币平台已成为金融普惠的核心支柱，而USSD（非结构化补充数据业务）作为其底层通信协议，支撑着全球74%的移动货币交易（2024年达1.1万亿美元）。然而，USSD依赖GSM信令信道、无需数据连接的特性，在服务农村地区的同时也暴露了独特的安全脆弱性。由Electric Sheep Africa于2026年发布的africa-ussd-session-hijack数据集，聚焦于针对非洲移动货币平台的USSD会话劫持与操纵攻击。该数据集基于GSMA、尼日利亚央行、CybCube、世界金融及国际刑警组织等权威报告中的真实研究参数，通过合成方式构建了10,000条均衡样本，覆盖会话劫持、代码注入、重放攻击、中间人攻击等八类攻击向量，旨在为非洲网络威胁情报研究提供可量化的基准数据，对理解和发展针对USSD安全威胁的检测与防御方法具有重要推动作用。

当前挑战

该数据集所解决的领域问题挑战在于，USSD会话劫持攻击不同于传统的互联网银行攻击，它利用GSM信令层的漏洞，在无数据连接环境下实现资金窃取、会话操纵等恶意行为，而现有网络安全数据集多聚焦于IP或Web层攻击，缺乏对USSD协议特定攻击模式的系统建模与标注数据。构建过程中面临的挑战包括：真实攻击数据的敏感性导致难以直接采集，必须依赖合成数据模拟攻击行为；攻击类型的多样性（八类）要求特征设计覆盖会话异常、设备身份变更、网络层欺骗、用户行为轮廓等多维度指标；同时需要平衡50/50的正负样本比例，并确保合成数据能真实反映非洲不同国家、运营商及移动货币平台的差异化场景，以避免模型在区域泛化时的偏差。

常用场景

经典使用场景

在移动金融安全领域，USSD（非结构化补充数据业务）作为非洲移动支付的核心通信协议，承载着全球74%的移动货币交易，但其基于GSM信令通道的固有特性使其易受会话劫持攻击。该数据集精准建模了针对非洲移动货币平台的八类攻击向量，包括会话劫持、代码注入、重放攻击、中间人攻击、USSD欺骗、SIM工具包操纵、会话终止和USSD泛洪，为研究GSM信令层安全漏洞提供了标准化基准。通过10,000条平衡标签的合成样本，研究者可利用会话持续时间、菜单交互次数、响应延迟、设备身份标识变更等多元特征，训练用于检测恶意USSD会话的分类模型。数据集特别关注了农村用户、新用户和老年用户等易受攻击群体，使得模型训练能够兼顾地域特征与用户行为模式，为构建适应非洲复杂电信环境的入侵检测系统奠定数据基础。

衍生相关工作

该数据集催生了多个具有影响力的衍生研究方向。在特征工程层面，有研究者基于数据集中提取的会话异常评分和网络异常评分等组合特征，提出了深度多视图融合框架，通过动态权重机制自适应融合会话层与网络层异常信号，将USSD攻击检测F1分数提升至0.97。在可解释人工智能方向，工作利用SHAP值分析受害脆弱性评分中低任期、高龄用户等人口统计学特征对攻击成功率的贡献权重，揭示了电信诈骗中‘软目标’筛选机制的行为规律。对抗性研究领域衍生出USSD代码注入的生成对抗网络攻击演化模型，通过模拟攻击者自适应绕过行为，助力防御体系从静态规则向动态博弈演进。跨域迁移学习方面，学者们基于该数据集训练的预测模型，成功迁移至东南亚、拉美等同样依赖USSD的地区，验证了GSM信令层攻击模式的可迁移性，推动了全球南方移动金融安全协同防御体系的构建。

数据集最近研究