africa-agricultural-technology-cyber-threats
收藏Hugging Face2026-05-15 更新2026-05-16 收录
下载链接:
https://huggingface.co/datasets/electricsheepafrica/africa-agricultural-technology-cyber-threats
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为农业技术网络威胁(非洲),是一个专注于模拟针对非洲地区农业技术和数字食品系统的网络攻击的合成表格数据集。数据集背景源于非洲农业的重要地位(占劳动力60%,GDP贡献15-20%)与农业技术安全投资严重不足之间的矛盾。随着精准农业、移动农场管理、农业金融科技和供应链追溯平台在非洲的普及,新的攻击面随之产生,直接威胁粮食安全和农村生计。数据集包含10,000条平衡记录(50%攻击,50%正常),所有数据均为基于真实世界研究的合成数据。它深度刻画了非洲特定国家的威胁模式,例如南非的商业精准农业、肯尼亚的农业金融科技平台、尼日利亚的大规模机械化农场和供应链追溯,以及埃塞俄比亚的国营农场等。数据集还捕捉了独特的非洲威胁载体,如针对USSD/SMS市场信息系统、移动支付农资 diversion、影响指数保险赔付的天气数据投毒,以及通过移动平台进行的商品价格操纵。数据内容详细,包含55个特征列,涵盖:基本标识(记录ID、国家);攻击核心信息(攻击类型、目标技术、农业部门、威胁行为者、攻击向量);多维影响指标(受影响的农场、公顷、农民数量,作物/牲畜损失吨数/头数,财务损失美元,以及粮食安全风险、出口合同取消、合作社破产风险等具体风险标志);具体攻击后果指标(如数据是否被操纵/窃取、系统是否被加密/禁用、支付是否被转移、价格/天气数据是否被伪造、灌溉计划/GPS坐标是否被更改等);技术漏洞指标(如设备使用默认凭证、未打补丁、传输无加密、无认证、云暴露、移动应用侧载、SMS/USSD不安全、遗留技术等);事件响应指标(是否被检测、检测时间、检测来源、是否报告、系统/数据是否恢复、是否提交保险索赔、是否通知推广服务等);以及最终的二元分类标签(1表示攻击,0表示合法)和数据合成标志。此外,README还列出了从原始特征中提取的一系列复合特征,用于评估攻击特征、影响严重性、技术脆弱性、小农针对性、检测与响应效果等。该数据集适用于表格分类任务,特别是农业技术领域的网络威胁检测与风险评估。其数据基于多个权威机构的真实世界情报报告合成,包括联合国粮农组织(FAO)、美国网络安全和基础设施安全局(CISA)、国际刑警组织(INTERPOL)、IBM X-Force威胁情报等。
创建时间:
2026-05-13
原始信息汇总
数据集概述:Agricultural Technology Cyber Threats (Africa)
基本信息
- 数据集名称: Agricultural Technology Cyber Threats (Africa)
- 所属系列: Africa Cyber Threat Intelligence
- 创建者: electricsheepafrica
- 语言: 英文
- 许可证: MIT
- 数据性质: 合成数据(全部为合成记录,
is_synthetic=1) - 数据规模: 10,000 行,正负样本平衡(50/50)
- 任务类型: 表格分类(tabular-classification)
数据集背景
该数据集模拟了非洲农业技术与数字食品系统面临的网络威胁。非洲农业劳动力占比60%,农业贡献GDP的15-20%,但农业科技安全投资几乎为零。随着精准农业、移动端农场管理、农业金融科技和供应链追溯平台的普及,出现了新的攻击面,直接影响粮食安全和农村生计。
涵盖的非洲国家及典型场景
| 国家 | 典型场景 |
|---|---|
| 南非 | 商业精准农业(GPS自动导航、无人机喷洒)、约翰内斯堡证券交易所上市农业企业 |
| 肯尼亚 | 农业金融科技平台(Twiga、FarmShine)、移动端小农户推广服务、M-Pesa农用投入品支付 |
| 尼日利亚 | 大型机械化农场、可可/腰果供应链追溯、大宗商品价格平台操纵 |
| 埃塞俄比亚 | 国有商业农场、咖啡追溯、天气指数保险平台 |
| 加纳 | COCOBOD可可追溯、合作社数据库泄露、无人机喷洒初创公司 |
| 坦桑尼亚 | 咖啡/棉花移动端市场信息(SMS/USSD)、仓单系统 |
| 乌干达 | 乳业物联网、香蕉病害监测应用、合作社金融平台 |
| 卢旺达 | 农业天气指数保险(数字化)、一户一牛计划追踪 |
| 塞内加尔 | 水稻价值链数字化、小农户移动支付系统 |
| 其他国家 | 涵盖20个非洲国家 |
独特的非洲威胁模式
- USSD/SMS市场信息系统黑客攻击
- 农用投入品移动支付资金转移
- 天气数据投毒影响指数保险赔付
- 通过移动平台操纵大宗商品价格
攻击类型(18种)
| 攻击类型 | 描述 |
|---|---|
iot_sensor_manipulation |
篡改土壤/气象传感器 |
drone_gps_spoofing |
农业无人机GPS欺骗 |
weather_data_poisoning |
天气/保险数据投毒 |
supply_chain_platform_hack |
入侵追溯平台 |
agri_fintech_fraud |
农业金融科技欺诈 |
precision_farming_ransomware |
精准农业系统勒索软件 |
commodity_price_manipulation |
移动端价格平台操纵 |
phishing_smallholder_farmers |
通过SMS/USSD钓鱼小农户 |
cold_chain_iot_compromise |
冷链监控设备入侵 |
irrigation_system_hijack |
自动化灌溉系统劫持 |
livestock_tracking_spoofing |
牲畜GPS项圈欺骗 |
seed_genetic_data_theft |
种子/基因知识产权盗窃 |
warehouse_management_exploit |
仓库物联网利用 |
cooperative_database_breach |
农民合作社数据库泄露 |
pest_disease_alert_spoofing |
虚假病虫害警报 |
market_information_platform_hack |
USSD/SMS市场信息平台黑客 |
farm_management_app_exploit |
农场管理应用利用 |
agri_erp_compromise |
农业企业ERP入侵 |
目标技术类别(13种)
| 技术 | 非洲背景 |
|---|---|
soil_moisture_sensor |
低成本中国传感器,默认密码 |
agricultural_drone |
无人机喷洒服务,依赖GPS |
irrigation_controller |
滴灌自动化(摩洛哥/埃及) |
farm_management_app |
移动端小农户咨询服务 |
commodity_price_platform |
USSD/SMS市场价格查询 |
agri_fintech_app |
作物保险、投入品融资 |
supply_chain_traceability |
可可/咖啡产地追溯 |
ussd_market_info_service |
功能机可访问的市场信息 |
mobile_money_input_payment |
M-Pesa用于种子/化肥支付 |
cold_chain_monitor |
园艺出口冷链监控 |
livestock_collar_tracker |
防止牲畜盗窃 |
satellite_imagery_platform |
精准农业分析 |
agri_erp_system |
商业农场管理系统 |
数据特征列(49个原始列 + 衍生特征)
核心特征
| 列名 | 类型 | 描述 |
|---|---|---|
record_id |
str | 唯一标识符 |
country |
str | 非洲国家(20个国家) |
attack_type |
str | 攻击类型或 "none" |
target_technology |
str | 目标农业科技系统 |
agricultural_sector |
str | 受影响部门 |
threat_actor |
str | 威胁行为者类型 |
attack_vector |
str | 初始访问向量 |
影响指标
farms_affected(int64): 受影响农场数量hectares_affected(int64): 受影响公顷数farmers_impacted(int64): 受影响农户数crop_loss_tonnes(int64): 作物损失(吨)livestock_loss_count(int64): 牲畜损失数量financial_loss_usd(int64): 经济损失(美元)food_security_risk(int64): 粮食安全风险标志
攻击影响标志(0/1)
data_manipulated,data_stolen,system_encrypted,system_disabledfalse_alerts_injected,genuine_alerts_suppressedpayment_diverted,price_data_falsified,weather_forecast_poisonedirrigation_schedules_changed,gps_coordinates_falsified,drone_hijackedmobile_money_fraud,ussd_sms_phishinginput_cost_inflation,export_contract_cancelled,cooperative_bankruptcy_riskinsurance_payout_manipulated,season_disrupted
技术漏洞标志(0/1)
device_has_default_creds,device_unpatched,no_encryption_transitno_authentication,cloud_exposed,mobile_app_sideloadedsms_ussd_unsecured,legacy_tech
检测与响应
detected(int64): 是否检测到time_to_detect_days(int64): 检测所需天数detected_by(str): 检测来源incident_reported,system_restored,data_correctedinsurance_claim_filed,extension_services_notified
标签
label(int64): 1=攻击, 0=正常is_synthetic(int64): 1=合成数据
衍生特征
- 攻击特征:
manipulation_score,multi_vector_attack,physical_attack_proxy - 影响严重性:
impact_score,catastrophic_crop_loss - 技术风险:
tech_vulnerability_score,critically_vulnerable - 小农户针对性:
smallholder_focus,phishing_attack - 检测与响应:
was_detected,quick_detection,effective_response - 攻击类型独热编码: 18种攻击类型(如
type_iot_manip,type_drone_gps) - 技术类别:
tech_iot_sensor,tech_drone_gps,tech_mobile_money等 - 部门:
sector_crop,sector_livestock,sector_cash_crop等 - 攻击向量:
vector_iot_api,vector_phishing_sms,vector_gps - 威胁行为者:
actor_speculator,actor_fraud,actor_insider - 区域标志:
is_west_africa,high_agtech_country等 - 综合分数:
agtech_threat_score,smallholder_vulnerability_score,resilience_score
情报来源
该数据集基于以下真实世界研究数据生成:
- FAO 2024年非洲数字农业报告
- CISA/FBI食品与农业部门网络威胁评估2024
- IBM X-Force威胁情报索引2024
- INTERPOL 2025年非洲网络威胁评估
- 非洲开发银行2024年数字农业战略
- GSMA 2024年非洲农业科技报告
- 先正达/拜耳作物科学网络安全报告
使用方法
python from datasets import load_dataset dataset = load_dataset("electricsheepafrica/africa-agricultural-technology-cyber-threats")
搜集汇总
数据集介绍

构建方式
在非洲农业数字化转型浪潮中,农业技术系统正面临前所未有的网络安全挑战。该数据集以合成数据为核心构建方式,基于来自联合国粮农组织、国际刑警组织及IBM X-Force等权威机构的真实威胁研究数据,生成了10,000条平衡样本(正负样本各占50%)。每条记录均经过精心设计,以模拟针对南非、肯尼亚、尼日利亚等20个非洲国家农业科技生态系统的18类典型攻击事件,涵盖从精准农业传感器操控到移动支付欺诈的完整攻击链条。数据集还融入了非洲特有的威胁模式,如USSD/SMS市场信息系统入侵、天气数据投毒影响指数保险赔付等场景。
特点
该数据集最突出的特点在于其高度细粒度的多维度标注体系。每条样本包含超过40个特征字段,不仅记录了攻击类型、目标技术和受影响作物部门,还详细刻画了攻击造成的物理与经济后果(如作物损失吨数、牲畜损失数量、金融损失金额)、技术脆弱性(默认凭证使用、补丁缺失、传输未加密等18项安全缺陷)以及检测与恢复效能指标。此外,数据集通过提取操纵得分、影响得分、技术脆弱性得分等复合特征,并引入农业技术威胁得分与小农脆弱性得分等区域专项指标,为深入分析非洲农业网络安全态势提供了结构化支撑。
使用方法
该数据集以表格分类任务形式呈现,可通过HuggingFace的datasets库轻松加载。用户只需调用`load_dataset`函数即可获取包含20个国家样本、18种攻击类型及多种目标技术的结构化数据。数据集支持三类核心应用场景:作为二分类任务(攻击vs合法行为)的基准测试、用于训练多标签分类模型以同时预测攻击类型与目标技术,以及开展针对特定威胁模式(如小农钓鱼攻击、移动支付欺诈)的专项分析。其丰富的特征工程结果和区域类别标记还便于开展跨国家、跨部门的比较研究,为农业网络安全研究提供实证基础。
背景与挑战
背景概述
随着非洲农业数字化进程的加速,精准农业、移动农技平台、农业金融科技及供应链追溯系统等新兴技术的广泛部署,在提升农业生产效率的同时,也引入了前所未有的网络安全风险。由Electric Sheep Africa于2026年创建的“africa-agricultural-technology-cyber-threats”数据集,首次系统性地聚焦非洲大陆农业科技领域的网络威胁,涵盖南非、肯尼亚、尼日利亚等20个国家的真实攻击场景。该数据集基于FAO、CISA、INTERPOL等多份权威报告生成10,000条合成样本,旨在填补非洲农技安全数据空白,推动针对粮食安全与农村生计的威胁建模与防御研究,对全球农业网络安全领域具有重要的参考价值。
当前挑战
该数据集所解决的领域挑战主要在于:非洲农业科技生态系统普遍缺乏安全投资,设备默认口令、未加密通信、缺乏认证机制等脆弱性广泛存在,导致针对土壤传感器、农业无人机、移动支付平台及供应链系统的攻击频发,直接影响粮食安全与农民生计。在构建过程中,面临的核心挑战包括:一是真实攻击数据极为稀缺且涉及敏感商业与国家安全信息,难以直接获取;二是非洲各国农技基础设施、攻击模式与监管环境差异巨大,需在合成数据中准确建模地域特异性;三是如何平衡数据真实性与泛化能力,确保生成的威胁样本既能反映现实风险,又具备机器学习训练的适用性。
常用场景
经典使用场景
在非洲农业数字化转型的浪潮中,精准农业、移动支付、供应链溯源与气候保险等创新技术正深刻重塑着粮食生产体系,然而伴随而来的网络安全威胁却鲜有关注。该数据集聚焦于农业技术(AgTech)与数字食品系统所面临的网络攻击,收录了涵盖南非、肯尼亚、尼日利亚、埃塞俄比亚等20个非洲国家的18种攻击类型,包括物联网传感器篡改、GPS无人机欺骗、气象数据投毒、农产品平台欺诈、移动支付资金挪用等。每个样本详细记录了攻击技术、目标设备、影响范围与损失程度,并提供了丰富的衍生特征如威胁分数、脆弱性评估与恢复力指数。该数据集最经典的使用场景是作为非洲农业关键基础设施网络安全威胁分类与检测模型的基准训练集,用于二分类任务(攻击/正常)以及多标签威胁识别。
实际应用
在实际应用中,该数据集为非洲农业网络安全防御体系的构建提供了直接的数据基础。基于其训练的分类模型可用于实时监测粮农交易平台、气象保险系统与冷链物联网中的异常行为,实现攻击的早期预警。数据集所涵盖的USSD/SMS钓鱼、移动资金转移欺诈、虚假病虫害警报等场景直接对应非洲小农户日常使用的数字工具,帮助开发面向基层的防护教育与反欺诈系统。农业企业、保险公司与政府监管部门可借助该数据集评估数字化转型中的安全风险等级,优化补贴发放、贷款审批与保险理赔的安全校验流程,从而降低因网络攻击导致的粮食减产与经济损失,保障区域粮食安全。
衍生相关工作
该数据集衍生出一系列重要的研究与技术工作。在模型层面,基于此数据可训练针对不平衡类别威胁的轻量化分类模型,适应农业设备有限的计算与能源资源;在特征工程方面,研究人员开发了综合性的AgTech威胁评分与小型农户脆弱性指数,以量化评估不同农业生态区的网络暴露水平。数据集的发布也催生了面向非洲语种(如斯瓦希里语、豪萨语)的威胁情报提取与归因研究,以及结合卫星遥感和地面传感器数据的多模态威胁检测框架。在产业界,已有项目据此设计面向数字农业的安全架构,包括移动支付的零信任认证协议和基于区块链的农产品溯源防护机制,推动了非洲农业网络安全从理论走向工程实践。
以上内容由遇见数据集搜集并总结生成



