five

electricsheepafrica/africa-who-reported-number-of-human-rabies-deaths

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-reported-number-of-human-rabies-deaths
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家2010年至2024年间世界卫生组织全球健康观察指标报告的人类狂犬病死亡人数(NTD_RAB2)的国家级观察数据。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO全球健康观察OData API,并以Parquet文件形式重新打包,具有一致的schema。所有数值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括了置信区间边界(value_low, value_high)。

This dataset contains country-level observations for the WHO GHO indicator Reported number of human rabies deaths (NTD_RAB2) across African nations, spanning 2010–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观测站(WHO GHO)的OData API,系统收集了2010年至2024年间42个非洲国家的人狂犬病死亡报告数据。原始数据经统一架构重新打包为Parquet文件,仅采用高精度浮点字段NumericValue中的数值,并保留了可获取的置信区间上下限。数据集以国家与年份为颗粒度,每一行对应单一观测值,无额外子维度分层,确保了数据的一致性与机器学习的友好性。
特点
数据集包含196条记录,覆盖非洲广袤区域,国家代码如AGO、KEN等一应俱全。其核心特点在于聚焦单一公共卫生指标NTD_RAB2,无性别或居住区类型等亚类划分,从而简化了分析复杂度。列模式包括指示符代码、ISO国家编码、年份、数值估计及置信区间,并附有显示字符串与更新时间戳,为流行病学建模与时间序列分析提供了干净、可直接使用的结构化数据。
使用方法
用户可通过HuggingFace的datasets库便捷加载,例如调用load_dataset函数并转换为Pandas数据框。使用时可依据dim1字段筛选全性别(_BTSX)或全国级数据,忽略空值以聚焦主要分析。如需国家特定时间序列,可对country_iso3列进行过滤,并按年份排序,从而高效开展狂犬病死亡率的区域比较与趋势挖掘。
背景与挑战
背景概述
狂犬病作为一种致死率近乎百分之百的人畜共患传染病,在全球范围内尤其是发展中国家构成了严峻的公共卫生威胁。世界卫生组织(WHO)长期致力于监测与消除该疾病,其全球卫生观测站(GHO)通过标准化指标追踪各国防治进展。在此背景下,由Electric Sheep Africa团队于2024年整理发布的“非洲WHO报告的人狂犬病死亡人数”数据集,聚焦于撒哈拉以南非洲地区,包含2010至2024年间42个国家的年度报告死亡数据。该数据集以CC BY 4.0许可开放,旨在弥合高质量非洲健康数据的缺失,为机器学习驱动的流行病学建模、资源分配优化及消除战略评估提供结构化、可复用的基础资源,进而助力实现WHO“2030年消除狂犬病”的全球目标。
当前挑战
该数据集所应对的领域挑战核心在于非洲地区狂犬病死亡数据的严重漏报与质量不一。由于基层诊断能力薄弱、监测系统不健全,许多死亡案例未被记录,导致基于报告数据的模型可能低估实际疾病负担,影响政策干预的精准性。在构建过程中,数据清洗面临显著困难:原始WHO API返回的数值存在显示字符串与浮点数值的差异,需严格提取NumericValue以确保一致性;同时,不同国家在年份间的数据缺失(196条记录覆盖42国14年)导致稀疏性问题,缺失值处理与置信区间(value_low, value_high)的整合对回归任务构成挑战。此外,亚维度(如性别、城乡)信息的非均匀存在要求开发者谨慎设计过滤逻辑,以避免偏误引入。
常用场景
经典使用场景
在流行病学与全球健康治理领域,非洲狂犬病死亡报告数据集(africa-who-reported-number-of-human-rabies-deaths)为跨国家、跨年度的狂犬病致死负担量化提供了标准化的数据基石。其经典用法是构建时间序列与空间对比分析框架,研究者可借助该数据集探索2010至2024年间42个非洲国家狂犬病死亡人数的演变趋势与区域性差异,进而评估各国消除犬传狂犬病的阶段性成效。同时,该数据集凭借其清洗一致、可直接加载至机器学习框架的特点,常被用于训练回归模型以预测未来死亡负荷,或结合社会经济指标开展多变量关联分析,揭示防控资源分配与死亡率变化之间的深层纽带。
实际应用
在实际公共卫生决策中,该数据集成为各国卫生部与国际组织(如WHO、非洲疾控中心)进行资源调配与干预效果评估的宝贵抓手。流行病学家可依据逐年波动与置信区间研判疫情暴发信号,或对比相邻国家数据以识别跨境传播的热点走廊。非政府组织在资助犬只疫苗接种项目和公众宣传教育时,亦能借助该数据集的细化指标(如城乡维度)精准锁定高风险区域。此外,将狂犬病死亡人数与狗群密度、疫苗覆盖率等外部数据融合,可辅助构建动态风险地图,实现从被动报告向主动预警的范式转变。
衍生相关工作
基于该数据集的衍生工作已催生出一系列富有影响力的学术与工程成果。在预测建模方面,研究者将其作为核心标签用于训练基于气候、人口与经济协变量的时空贝叶斯模型,推估未完整报告国家的潜在死亡规模。在数据可视化领域,交互式仪表板如“非洲狂犬病瞭望台”将该数据作为基底图层,实时呈现各国消除进展的晴雨表。此外,该数据集还被整合进多源传染病数据库One Health平台的构建中,与人畜共患病早期预警系统联动,形成从死亡监测到干预响应的完整数据链路,为迈向2030年全球零狂犬病死亡目标提供了可复现的分析范例。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务