five

electricsheepafrica/africa-who-women-age-15-49-years-who-received-a-health-check-within-2

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-women-age-15-49-years-who-received-a-health-check-within-2
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含WHO GHO指标15-49岁女性在最近两年内分娩后两天内接受健康检查的百分比(UNICEF_PNCMOTHER)在非洲国家的国家级观测数据,时间跨度为2010年至2017年。它是Electric Sheep Africa项目的一部分,该项目是一个统一的、适合机器学习使用的非洲数据仓库。数据直接从WHO Global Health Observatory OData API获取,并以Parquet文件形式重新打包,具有一致的架构。所有数值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator "Women age 15-49 years who received a health check within 2 days after delivery of their most recent live birth in the last 2 years (%)" (`UNICEF_PNCMOTHER`) across African nations, spanning 2010–2017. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
本数据集源于世界卫生组织全球卫生观察站(WHO GHO)的开放数据接口,针对非洲地区女性产后健康检查覆盖率这一关键指标进行系统化整合。原始数据通过OData API自动采集,并经过重新封装形成统一Parquet格式的数据文件,确保了数据结构的一致性与机器学习友好性。所有数值均从高精度的浮点型字段直接提取,而非依赖显示字符串,并保留了置信区间上下界信息以增强统计可靠性。该数据集覆盖2010至2017年间37个非洲国家的66条国家级观测记录,每条记录对应特定国家与年份的唯一指标值,未包含额外子维度分层。
使用方法
本数据集可直接通过HuggingFace Datasets库加载使用,仅需一行Python代码即可获得完整的训练格式数据集。用户可调用to_pandas()方法将其转换为DataFrame进行后续分析。数据使用上,可通过维度字段过滤以获取特定分析视角,例如筛选dim1列中后缀为'_BTSX'的记录获取两性合计的国家级数据,或按国家ISO代码切片获取单个国家的时间序列。结合value_numeric作为回归目标,value_low与value_high可作为不确定性建模的辅助特征。该数据集兼容监督学习中的表格分类与回归任务,为非洲产后保健领域的机器学习研究提供了标准化、高质量的数据基础。
背景与挑战
背景概述
该数据集源自世界卫生组织(WHO)全球卫生观察站(GHO),由Electric Sheep Africa团队整理并发布,聚焦于非洲地区15至49岁女性在最近一次活产分娩后两天内接受健康检查的比例(2010-2017年)。作为衡量产后护理可及性的关键指标,该数据揭示了非洲孕产妇健康服务的覆盖状况,为研究区域卫生不平等、评估干预措施效果提供了量化基础。数据集覆盖37个非洲国家,共66条记录,其简洁的表格化结构(含置信区间)便于机器学习模型直接应用于分类与回归任务,对推动非洲公共卫生领域的计算社会科学研究具有重要价值。
当前挑战
该数据集所应对的领域问题在于,产后健康检查是降低孕产妇与新生儿死亡率的核心干预手段,但非洲地区长期面临服务覆盖率低与数据稀疏性并存的挑战——37个国家仅66条记录意味着多数年份数据缺失,难以支撑细粒度时间序列分析。构建过程中,原始数据从WHO的API提取后需处理跨年度、跨国别的非标准化标注(如维度字段包含性别、居住地类型等混合编码),同时需将置信区间等附属信息整合为一致模式,工作量集中于数据清洗与元数据对齐,而非样本量的扩充。
常用场景
经典使用场景
该数据集聚焦于非洲地区15至49岁女性在最近一次活产分娩后两天内接受健康检查的比例,是评估产后护理覆盖率的经典指标。研究者常利用此数据集进行跨国家、跨年份的纵向比较分析,以揭示非洲各国在孕产妇健康服务可及性方面的差异与演变趋势。通过挖掘其数值型核心指标与置信区间信息,可构建回归或分类模型,预测影响产后检查率的关键社会经济与卫生系统因素。
解决学术问题
此数据集直接服务于全球健康与公共卫生领域的核心议题——孕产妇与新生儿健康结局的改善。它解决了产后护理服务覆盖率的量化监测难题,使学者能够识别服务薄弱环节、评估干预措施成效,并探索不同国家卫生政策与资源配置对产后健康检查率的实际影响。该数据集填补了非洲地区产后护理标准化数据的空白,为联合国可持续发展目标中降低孕产妇死亡率的相关研究提供了坚实的数据基石,推动了基于证据的卫生政策制定。
实际应用
在实际应用中,该数据集的形态天然适配于机器学习工作流,可被便捷地加载用于预测建模与数据分析。公共卫生机构与非政府组织可借助该数据集训练预警模型,识别产后护理覆盖率低下的高风险地区,从而优化资源投放与医疗援助规划。此外,数据集的低维度、高时效特点使其适合集成至非洲健康监测仪表盘,支持决策者进行实时追踪与动态评估,推动产后护理服务的精准改进。
数据集最近研究
最新研究方向
该数据集聚焦于非洲育龄女性产后48小时内接受健康检查的比例,是衡量母婴健康服务质量的关键指标。当前前沿研究正将此类数据与机器学习模型结合,用于预测非洲各国在可持续发展目标(SDG)框架下降低孕产妇死亡率的进展。结合世界卫生组织全球健康观测站(GHO)的开放数据,研究者通过时序分析揭示区域 disparities,并探索社会经济与环境因素对产后护理覆盖率的交互影响。该数据集为非洲大陆的循证政策制定提供了基础,尤其在COVID-19大流行后,产后健康服务可及性的恢复与优化成为热点,其跨年度、多国别的结构化特征支持了时空建模与健康系统韧性评估,对推动非洲实现全民健康覆盖具有深远意义。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务