electricsheepafrica/africa-who-percentage-of-sites-for-which-carbamate-resistance-was
收藏Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-percentage-of-sites-for-which-carbamate-resistance-was
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家在2000年至2015年间报告氨基甲酸酯抗性的百分比数据,是世界卫生组织全球健康观察站(WHO GHO)指标的一部分。数据来源于WHO GHO OData API,并重新打包为Parquet文件,包含数值、置信区间等信息。数据集覆盖33个非洲国家,共173行数据,区域筛选为WHO AFRO。数据模式包括指标代码、国家ISO3代码、WHO地区代码、年份、数值估计值、置信区间上下限、显示字符串等字段。
This dataset contains country-level observations for the WHO GHO indicator "Percentage of sites for which carbamate resistance was reported" (`IR_CARBAMATE_EXTENT`) across African nations, spanning 2000–2015. It is part of the [Electric Sheep Africa](https://huggingface.co/electricsheepafrica) collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区2000年至2015年间关于氨基甲酸酯类杀虫剂抗药性报告位点百分比(指标代码IR_CARBAMATE_EXTENT)的国别观测数据。数据经过系统化清洗与整合,以Parquet文件格式存储并采用统一模式,核心字段直接提取自API返回的浮点精度数值(NumericValue),而非格式化展示字符串。若原始数据提供置信区间,则一并纳入低值(value_low)与高值(value_high)字段,确保分析精度的完整性。
特点
该数据集涵盖33个非洲国家,共计173条记录,是面向机器学习任务精心整合的非洲健康数据资源之一。其显著特点在于数据维度的纯净性:每个国家-年份组合仅有单一观测值,无需处理多维度分层(如性别或年龄组),从而简化了建模流程。然而,当分层存在时,通过dim1与dim2字段可精准筛选指定亚群(如全国范围或两性混合数据),赋予用户灵活的子集提取能力。此外,数据以标准ISO国家代码和WHO区域代码标识地理单元,便于跨数据集融合与时空分析。
使用方法
用户可通过Hugging Face的datasets库直接加载该数据集:使用load_dataset函数指定仓库标识符,即可获取训练集并转换为Pandas DataFrame进行后续操作。示例用法包括:通过过滤dim1字段中以'_BTSX'结尾或空值条目,提取两性混合的全国级别数据;或利用country_iso3字段锁定特定国家(如'KEN'代表肯尼亚),并结合year字段排序,绘制时间序列趋势。该方法为研究人员提供了低门槛、高灵活性的数据接入路径,适用于回归或分类任务的模型训练与评估。
背景与挑战
背景概述
在公共卫生领域,病媒对杀虫剂产生的抗药性已成为全球疾病控制的一大威胁,尤其对于疟疾等虫媒传染病的防控构成了严峻挑战。世界卫生组织(WHO)发布的氨基甲酸酯类杀虫剂抗药性监测数据,为评估和应对这一危机提供了关键依据。该数据集由Electric Sheep Africa团队整理,源自WHO全球卫生观察站(GHO),聚焦2000至2015年间非洲33个国家的监测站点,记录了氨基甲酸酯类杀虫剂抗药性报告点的百分比。作为首个面向机器学习的非洲地区杀虫剂抗药性结构化数据集,它填补了区域健康数据在标准化与开放共享方面的空白,推动了流行病学建模与抗药性趋势分析的发展。
当前挑战
该数据集构建过程中面临的核心挑战源于领域问题与数据处理的复杂性。在领域层面,氨基甲酸酯类杀虫剂抗药性的时空分布受多重因素影响,包括杀虫剂使用历史、生物进化压力及环境条件,使得从稀疏的站点数据中提取稳健的流行病学信号极为困难。在数据构建方面,GHO原始数据格式不一致、缺失值(如置信区间不完整)以及国家对年份的不均匀覆盖(仅173条记录)均增加了清洗与标准化的难度。此外,缺乏子维度(如按性别或城乡分层)使得解析抗药性异质性受限,需借助额外的外部数据集才能深入挖掘潜在的环境与社会驱动因素。
常用场景
经典使用场景
该数据集的核心应用场景在于监测非洲地区疾病传播媒介对氨基甲酸酯类杀虫剂产生抗药性的时空演变格局。凭借其覆盖2000年至2015年间33个非洲国家的173条记录,研究者能够利用该数据集开展基于面板数据的回归分析,评估杀虫剂抗性在非洲不同地区扩散的趋势与速率。该数据集的经典用法包括构建机器学习分类模型,预测某一国家或地区在特定年份是否报告了高比例的杀虫剂抗性位点,以及通过时间序列建模捕捉抗性增长的动态轨迹,为公共卫生决策提供数据支撑。
衍生相关工作
围绕该数据集衍生出的相关工作体现了其在公共卫生数据分析生态中的桥梁作用。作为Electric Sheep Africa项目的一部分,该数据集被嵌入到一个涵盖非洲健康、环境、农业等多领域参数的标准化数据仓库中,催生了跨学科的综合预测模型。在此基础上,研究者已开展结合气象变量与杀虫剂使用数据的联合分析,探索气候因子对抗性传播的影响机制。同时,该数据集的清洗与整合框架也为其他WHO指标的自动化处理提供了可复用的代码范式,推动了机器学习在热带病流行病学中更广泛的应用实践。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区病媒对氨基甲酸酯类杀虫剂抗药性的监测,其最新研究方向在于利用机器学习模型对2000至2015年间33个非洲国家的抗性报告率进行时空建模。当前,疟疾控制中杀虫剂抗药性的蔓延已成为全球公共卫生的重大挑战,该数据集为评估抗性分布、预测热点区域及指导干预策略提供了关键定量基础。结合世界卫生组织全球卫生观测站的数据源,研究者正探索将此类结构化指标与环境、气候变量融合,构建预测性预警系统,以支持精准防控决策,其对非洲区域病媒控制政策的影响深远且意义重大。
以上内容由遇见数据集搜集并总结生成



