electricsheepafrica/africa-who-proportion-of-births-delivered-in-a-health-facility
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-proportion-of-births-delivered-in-a-health-facility
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了非洲国家在1990年至2024年间,由世界卫生组织全球健康观察站(WHO GHO)收集的在医疗机构分娩的比例(%)指标的国家级观测数据。数据集是[Electric Sheep Africa](https://huggingface.co/electricsheepafrica)集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO Global Health Observatory OData API获取,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自`NumericValue`(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(`value_low`,`value_high`)。数据集覆盖了46个非洲国家,共计279行记录。
This dataset contains country-level observations for the WHO GHO indicator Proportion of births delivered in a health facility (Facility births) (%) across African nations, spanning 1990–2024. It is part of the [Electric Sheep Africa](https://huggingface.co/electricsheepafrica) collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available. The dataset covers 46 African nations with a total of 279 rows.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(GHO)的OData API,聚焦非洲地区卫生机构内分娩比例这一关键指标。数据由Electric Sheep Africa团队重新整合,以Parquet格式存储,并统一采用一致的架构。所有数值均取自高精度的浮点字段NumericValue,而非显示字符串。数据集涵盖1990年至2024年间46个非洲国家的279条观测记录,每条记录对应一个国家与年份的组合,并包含置信区间上下限等辅助信息,确保数据在机器学习任务中的直接可用性。
使用方法
用户可通过HuggingFace的`datasets`库便捷加载该数据集,直接调用`load_dataset`函数即可获取包含279条记录的‘train’分割。加载后,数据可轻松转换为Pandas DataFrame进行进一步分析。典型用法包括过滤出全国范围且为两性混合的数据,以及按国家(如肯尼亚,ISO代码KEN)筛选并排序后构建时间序列。数据集的列设计清晰,可直接作为回归或分类任务的输入特征,尤其适用于预测模型训练与健康政策效果评估。
背景与挑战
背景概述
在非洲地区,孕产妇和新生儿健康一直是公共卫生领域的核心议题。世界卫生组织(WHO)将“医疗机构分娩比例”视为评估孕产妇保健可及性与质量的关键指标。该数据集由Electric Sheep Africa团队于2024年整理发布,源于WHO全球卫生观察站(GHO)的官方数据,覆盖1990至2024年间46个非洲国家的年度观测值,共计279条记录。通过系统化的数据整合与标准化架构,该数据集为研究非洲孕产妇保健服务的覆盖趋势、区域差异及政策干预效果提供了可靠的基础,推动了机器学习在公共卫生领域的应用,尤其对资源有限地区的发展规划具有重要参考价值。
当前挑战
该数据集面临的核心挑战在于,医疗机构分娩比例在不同非洲国家间的统计口径、数据采集方式与质量存在显著异质性,可能导致模型泛化能力受限。构建过程中,需应对WHO原始API中缺失值、置信区间不完整以及维度结构复杂(如按性别或地域细分)等数据处理难题,同时需确保跨年份的时序一致性。此外,仅有279条样本量限制了深度学习等数据密集型方法的适用性,需依赖传统统计或小样本学习技术。区域内部的社会经济与地理差异也增加了模型在预测欠发达地区覆盖水平时的偏差风险。
常用场景
经典使用场景
该数据集聚焦于非洲国家在1990至2024年间医疗机构分娩占比的宏观监测,其核心应用在于评估孕产妇保健服务的可及性与利用水平。研究者和公共卫生专家可借助此数据构建时间序列模型,纵向追踪各国在提升安全分娩方面的进展,或通过横截面比较揭示区域内部的不均衡现象。作为世界卫生组织全球卫生观察站的关键指标,该数据常被用于验证健康干预政策的有效性,并为实现可持续发展目标中关于降低孕产妇死亡率的子目标提供量化支撑。
解决学术问题
数据集直面非洲大陆孕产妇健康领域的核心学术困境——即缺乏统一、结构化且可供机器学习直接使用的面板数据。它解决了跨国家、跨年度比较分析中数据碎片化与口径不一致的难题,使得研究者能够量化社会经济因素、卫生系统投入与机构分娩率之间的因果关联。通过提供置信区间,该数据还助力解决推断统计中的不确定性估计问题,为探讨卫生政策干预的边际效应、孕产妇死亡风险的预测因子等经典研究议题奠定了坚实的数据基础,深刻影响了全球健康不平等的实证研究范式。
实际应用
在实际应用中,该数据集为国际组织及非洲各国卫生部门的决策制定提供了数据驱动的洞察。发展机构可利用其对援助项目进行影响评估,例如衡量助产士培训或基层诊所建设投入对安全分娩率的提升效果。国家公共卫生机构则能借此识别高风险的区域或人群,从而精准分配医疗资源,改善偏远地区的产科急救服务。此外,该数据也支撑着智能预警系统的开发,通过监测机构分娩比例的异常波动,为疫情的间接影响或卫生系统的脆弱性提供早期预警信号。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区医疗机构分娩比例,为追踪全球孕产妇健康改善、评估“可持续发展目标”(SDG 3.1)中降低孕产妇死亡率进展提供了关键定量依据。当前前沿研究方向包括利用该结构化面板数据训练时间序列预测模型,以预判脆弱国家卫生系统应对产科紧急能力的演变;同时,结合空间统计及因果推断方法,分析医疗机构覆盖差异与冲突、气候变化等宏观扰动之间的交互影响,从而为非洲区域卫生政策制定和资源精准投放提供数据驱动的决策支持。
以上内容由遇见数据集搜集并总结生成



