electricsheepafrica/africa-who-number-of-confirmed-yaws-cases-reported
收藏Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-number-of-confirmed-yaws-cases-reported
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家2017年至2024年间报告的雅司病确诊病例数的国家级别观察数据。数据集来源于WHO Global Health Observatory,并经过Electric Sheep Africa重新打包为Parquet格式,具有一致的架构。所有数值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。
This dataset contains country-level observations for the WHO GHO indicator "Number of confirmed yaws cases reported" (`NTD_YAWSNUM_CONF`) across African nations, spanning 2017–2024. It is part of the [Electric Sheep Africa](https://huggingface.co/electricsheepafrica) collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观测站的OData API,聚焦于非洲地区确诊雅司病报告病例数这一核心指标(指标代码NTD_YAWSNUM_CONF)。它属于Electric Sheep Africa项目,旨在将非洲数据整合为统一的、可直接用于机器学习的格式。数据以Parquet文件形式存储,并采用一致的schema结构。所有数值均取自具有浮点精度的NumericValue字段,而非用于展示的字符串,同时保留了置信区间上下限(value_low与value_high)。数据集覆盖2017至2024年间15个非洲国家(如安哥拉、贝宁、科特迪瓦等),共计61条观测记录,每条记录对应国家与年份的唯一组合,且无子维度分层。
使用方法
使用该数据集时,可通过HuggingFace datasets库便捷加载:使用load_dataset函数指定仓库名称即可获得训练集。随后可调用to_pandas()方法将数据转换为Pandas DataFrame以进行后续分析。若需关注全国总体水平,可筛选dim1字段以排除按性别或居住地类型分层的子组(例如选取以_BTSX结尾或该字段为空的记录)。针对单国时间序列分析,可按country_iso3列过滤特定国家(如KEN代表肯尼亚),再按year排序即可。数据加载与预处理流程简洁高效,适合快速开展雅司病流行趋势的建模与可视化工作。
背景与挑战
背景概述
雅司病(Yaws)是一种被忽视的热带疾病,主要影响非洲等资源匮乏地区的儿童,其监测与防控是全球公共卫生领域的重要议题。非洲雅司病确诊病例报告数据集由世界卫生组织(WHO)全球卫生观测站(GHO)于2017年至2024年间收集,并由Electric Sheep Africa团队整理为机器学习就绪格式。该数据集聚焦于15个非洲国家的雅司病确诊病例数量,旨在将分散的公共卫生统计转化为结构化、可复用的数据资源,支持针对这一被忽视疾病的建模、趋势分析与政策评估。作为WHO开放数据计划的一部分,该数据集采用CC BY 4.0许可协议,显著降低了非洲卫生数据的获取门槛,推动了数据驱动下的区域传染病控制研究。
当前挑战
该数据集核心挑战源于雅司病监测本身的复杂性:病例确诊依赖实验室检测与基层报告系统,在许多非洲国家面临诊断资源匮乏、报告标准不统一的问题,导致数据完整性不足。数据集中仅有61条记录,覆盖15国,稀疏性限制了时间序列预测与空间传播模型的施展。此外,WHO API原生数据包含置信区间与分层维度的冗余字段,需清洗以聚焦于点估计值,同时缺失值的处理与跨年可比性的保障是构建可靠模型的关键障碍。数据集的小众性也意味着缺乏基准模型,增加了验证与扩展的难度。
常用场景
经典使用场景
该数据集的核心用途在于追踪非洲地区雅司病确诊病例的时空分布,为传染病流行病学研究提供量化基础。研究者可基于2017至2024年间15个非洲国家的年度观测数据,构建时序分析模型以揭示雅司病的传播动态。凭借其结构化的指标编码与标准化的数值字段,该数据集尤其适用于监督学习任务,如基于国家特征与时间特征的病例数回归预测,或依据疫情严重程度进行区域分类。此外,数据中附带的置信区间信息为不确定性量化提供了宝贵素材,助力鲁棒预测模型的开发。
解决学术问题
雅司病作为一种被忽视的热带病,其监测数据长期存在碎片化与不透明问题,严重制约了全球卫生治理中的循证决策。该数据集通过统一整合世界卫生组织全球卫生观测站的官方记录,系统性解决了非洲地区雅司病报告数据难以获取、格式不统一的核心痛点。它为学术研究提供了首个机器学习就绪的标准化跨国产出,使得研究者能够开展纵向比较分析、评估干预措施的有效性,并识别疫情热点区域。这些工作的展开,对于推动实现世界卫生组织提出的雅司病消除目标具有重要的数据支撑意义。
实际应用
在实际公共卫生行动中,该数据集可直接服务于非洲疾病预防控制机构的监测预警系统。各国卫生部门可利用历史病例数训练轻量级预测模型,提前预估下一周期可能的病例激增趋势,从而优化医疗资源调配和筛查策略。对于国际非政府组织而言,其可作为项目影响评估的基线数据,量化雅司病根除运动在特定国家或地区的实施成效。此外,该数据集的开放许可特性(CC BY 4.0)降低了使用门槛,鼓励数据新闻机构与公共卫生倡导者通过可视化仪表盘向公众传递疫情态势,增强社区参与意识。
数据集最近研究
最新研究方向
该数据集聚焦于世界卫生组织非洲区域成员国经确认的雅司病病例报告数量,时间跨度为2017至2024年,覆盖15个非洲国家。雅司病作为一种被忽视的热带病,近年随着全球健康监测体系的完善和消除战略的推进,其流行病学动态再度成为国际公共卫生领域的关注焦点。数据集的标准化整合为机器学习驱动的时空流行病学建模、疾病负担评估及干预措施效果分析提供了高质量的结构化基础,尤其在缺医少药的非洲地区,此类精细粒度的历时性病例数据对于验证消除雅司病全球倡议的实际成效、识别高流行聚集区及指导资源配置具有不可替代的前沿价值。依托WHO全球卫生观测站的权威数据源,该数据集也促进了开放科学框架下非洲本地健康数据的可复用性,为跨学科交叉验证和预测预警系统的构建铺平了道路。
以上内容由遇见数据集搜集并总结生成



