electricsheepafrica/africa-who-population-with-basic-handwashing-facilities-at-home
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-population-with-basic-handwashing-facilities-at-home
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)关于非洲国家在家中拥有基本洗手设施的人口百分比(指标代码:WSH_HYGIENE_BASIC)的国家级观察数据,时间跨度为2000年至2024年。数据集是Electric Sheep Africa项目的一部分,该项目是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来自WHO Global Health Observatory的OData API,并以Parquet文件形式重新打包,具有一致的架构。所有数值均来自浮点精度字段(NumericValue),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集覆盖43个非洲国家,总行数约为1,000行,并包含多个子维度(如居住地区类型:农村、总计、城市)。
This dataset contains country-level observations for the WHO GHO indicator "Population with basic handwashing facilities at home (%)" (WSH_HYGIENE_BASIC) across African nations, spanning 2000–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available. The dataset covers 43 African nations with approximately 1,000 rows and includes sub-dimensions such as residence area type (rural, total, urban).
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(GHO)的开放数据接口,聚焦于非洲地区拥有基本洗手设施的家庭人口比例这一核心卫生指标。通过调用OData API,原始数据被系统性地抽取并重新封装为格式统一的Parquet文件,确保字段一致性。所有数值均采自浮点精度的`NumericValue`字段,而非显示字符串,同时保留了置信区间边界值`value_low`与`value_high`,为统计推断提供了可靠支撑。数据集涵盖了2000年至2024年间43个非洲国家的观测数据,共计约1000行记录,每个观测行均按国家、年份及可能的子维度(如城乡类型)进行唯一标识,构成了一个结构严谨、便于机器学习直接使用的表格型数据集。
使用方法
用户可通过HuggingFace的`datasets`库便捷加载该数据集,执行`load_dataset("electricsheepafrica/africa-who-population-with-basic-handwashing-facilities-at-home")`即可获得可直接转换为Pandas DataFrame的训练集。针对不同分析目标,可利用`dim1`字段进行子集过滤,例如筛除性别分层数据后仅保留双性总体(`_BTSX`后缀)的全国层面观测值,或通过`country_iso3`字段选取特定国家(如肯尼亚,ISO代码'KEN')并按年份排序以构建时间序列。该数据集既适用于分类任务,也适用于回归预测,支持以国家、年份等为特征的统计建模与趋势分析,示例代码已集成于数据集页面供用户直接参考。
背景与挑战
背景概述
在全球公共卫生领域,基本洗手设施的普及率是衡量传染病防控能力与可持续发展目标进展的关键指标。由世界卫生组织(WHO)全球卫生观察站(GHO)发布、Electric Sheep Africa整理的africa-who-population-with-basic-handwashing-facilities-at-home数据集,于2024年正式面向机器学习社区开放。该数据集聚焦非洲地区,涵盖2000至2024年间43个非洲国家的年度观测值,核心研究问题在于量化非洲人口在家中使用基本洗手设施的比例,从而为卫生政策制定与健康不平等分析提供数据基础。作为首个以机器学习就绪格式整合非洲区域这一关键卫生指标的数据资源,它填补了非洲健康数据在结构化、标准化与可复用性方面的空白,对推动基于数据的健康干预模型与区域比较研究具有重要价值。
当前挑战
该数据集所应对的领域挑战在于,非洲地区长期缺乏可靠且粒度一致的卫生设施覆盖率数据,传统统计资料常因时间跨度长、国家间定义差异与报告频次不一而难以直接用于预测建模。数据集构建过程中面临的核心难点包括:从WHO GHO OData API中抽取NumericValue字段而非显示字符串,需确保精度与一致性;多层子维度(如城乡类型、性别)导致同一国家年份产生多条记录,必须设计清晰的分组与过滤逻辑以免混淆;置信区间字段(value_low、value_high)存在大量缺失,需谨慎处理以维持分析稳健性。此外,数据来源仅覆盖WHO AFRO区域,尚缺北非部分国家,限制了全非洲范围内模型的外推能力。
常用场景
经典使用场景
在公共卫生与传染病防控研究领域,该数据集被广泛用于构建预测模型,以评估非洲各国的基础洗手设施普及率随时间的变化趋势。研究人员可基于43个非洲国家2000至2024年的年度观测数据,结合城乡分层变量,利用回归分析或时间序列方法,揭示洗手设施覆盖率与卫生干预政策、经济发展水平之间的关联规律。
解决学术问题
该数据集有效解决了非洲地区洗手设施覆盖率数据碎片化、标准不统一的学术困境,为衡量全球可持续发展目标中“人人享有清洁饮水与卫生设施”的进展提供了标准化、机器可读的量化依据。通过置信区间信息,研究者可评估估计值的可靠性,从而更严谨地分析卫生条件改善的真实成效及其对传染病传播的抑制效应。
实际应用
在实际应用层面,该数据可作为国际卫生组织、各国疾控部门及非政府组织制定干预策略的决策支撑工具。例如,通过识别洗手设施覆盖率长期低下的国家与区域,优先配置水资源与卫生物资;结合城乡二元分层,可针对不同地理单元设计差异化的健康促进计划,提升公共卫生资金的投放效率。
数据集最近研究
最新研究方向
在当前全球公共卫生治理与数据驱动决策的交汇点上,该数据集的核心意义在于为非洲地区的基础卫生设施覆盖研究提供了标准化的、机器学习就绪的纵向面板数据。前沿研究方向聚焦于利用时序分析与空间统计建模,揭示2000至2024年间43个非洲国家在基本洗手设施普及率上的时空演变轨迹与区域异质性,尤其关注城乡分异(RESIDENCEAREATYPE分层)对指标波动的影响。随着世界卫生组织(WHO)将手部卫生纳入全球疫情防范与卫生系统韧性建设的核心议程,该数据集成为评估非洲实现可持续发展目标6.2(安全管理的卫生设施)进展的关键量化工具。近期热点应用包括将置信区间(value_low/value_high)纳入不确定性量化框架,以校准政策干预的优先级排序,以及结合COVID-19大流行前后的时间断面,剖析卫生行为习惯的突变与长期趋同效应,为“同一健康”理念下的基础设施投资决策提供证据基础。
以上内容由遇见数据集搜集并总结生成



