five

electricsheepafrica/africa-who-proportion-of-newborns-who-have-postnatal-contact-with-a

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-proportion-of-newborns-who-have-postnatal-contact-with-a
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察指标“新生儿在出生后2天内与医疗服务提供者进行产后接触的比例(%)”(UNICEF_PNCNEWBORN)在非洲国家的国家级观察数据,时间跨度为2010年至2017年。该数据集是Electric Sheep Africa系列的一部分,这是一个统一的、适合机器学习使用的非洲数据仓库。数据直接来源于WHO Global Health Observatory的OData API,并以Parquet文件格式重新打包,具有一致的架构。所有数值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator "Proportion of newborns who have postnatal contact with a health provider within 2 days of delivery (%)" (`UNICEF_PNCNEWBORN`) across African nations, spanning 2010–2017. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
本数据集源自世界卫生组织全球卫生观察站(WHO GHO)的官方OData API,聚焦于非洲地区新生儿在出生后两天内接受医疗保健提供者产后接触的比例(UNICEF_PNCNEWBORN)。数据经过系统化的重新封装,以Parquet格式统一存储,确保机器学习任务的便捷调用。收录了2010年至2017年间35个非洲国家的53条观测记录,所有数值均采用浮点精度的NumericValue字段,并附有置信区间上下限(value_low与value_high),以增强统计可靠性。
特点
该数据集具备高度结构化与标准化特性,每个国家-年份组合对应单一行,无额外子维度分层,便于直接进行时间序列分析。其架构完整涵盖核心指标代码、国家ISO代码、WHO区域、年份、数值估计及置信区间,并保留原始显示字符串与更新时间戳。数据来源权威且遵循CC BY 4.0许可协议,特别适用于非洲大陆的新生儿健康监测与跨国产后保健服务覆盖率的比较研究。
使用方法
用户可通过HuggingFace Datasets库便捷加载数据,使用load_dataset函数直接获取训练集,并支持转换为Pandas DataFrame进行深度分析。推荐通过筛选dim1字段中值为'BTSX'的行或空值行,以获取两性汇总的国家级数据;同时可利用country_iso3列按国家过滤,如筛选'KEN'并排序年份,以构建特定国家的时间序列趋势。数据集无缺失值处理需求,且因其小规模特性(n<1K),适合作为教学或验证模型的基础数据源。
背景与挑战
背景概述
该数据集由世界卫生组织(WHO)全球卫生观察站(GHO)创建,并由Electric Sheep Africa团队于2023年左右重新整理和发布,聚焦非洲地区新生儿在分娩后2天内与卫生服务提供者进行产后接触的比例(指标代码UNICEF_PNCNEWBORN)。这一指标是评估母婴健康服务可及性和质量的关键变量,直接关联联合国可持续发展目标(SDGs)中降低新生儿死亡率的目标。数据集覆盖2010至2017年间35个非洲国家的国家层面观测数据,共53行,以Parquet格式存储,便于机器学习任务使用。作为首个经统一架构清洗并面向机器学习优化的非洲健康数据集之一,它填补了该区域产后护理领域结构化、可复现数据的空白,为跨境健康研究、政策评估及预测建模提供了可靠基础。
当前挑战
该数据集所解决的领域核心挑战在于非洲地区产后护理覆盖率的量化监测与预测问题,由于数据稀疏、国家间统计标准不一以及历史记录缺失,传统分析难以捕捉时空动态。构建过程中遭遇了多重困难:首先,原始GHO数据以OData API提供,格式各异且存在缺失值,需要从NumericValue字段而非展示字符串中提取精确浮点数;其次,仅半数观测包含置信区间(value_low, value_high),限制了不确定性建模的能力;最后,数据按国家-年份聚合,未提供年龄或性别亚组分析,且部分国家年份数据完全缺失,导致样本量仅53条,对机器学习模型的泛化能力构成显著制约。
常用场景
经典使用场景
该数据集聚焦于非洲地区新生儿在分娩后两天内获得医疗服务机构产后接触的比例,是衡量母婴健康服务质量与可及性的关键指标。经典使用场景包括利用该数据构建时间序列预测模型,分析各国新生儿产后护理覆盖率的演变趋势,或通过分类与回归任务识别影响产后接触率的核心因素。数据以国家-年份为基本单元,蕴含年份、国家代码、估计值及置信区间等结构化字段,为量化分析提供了坚实基础,尤其适合探索非洲区域内不同国家健康体系的效能差异。
衍生相关工作
该数据集衍生了一系列具有影响力的相关工作。其作为WHO全球健康观察站开放数据的重要组成部分,常被纳入区域性健康指标综合分析平台,用于对比非洲与其他发展中国家或地区的产后护理现状。此外,数据集的标准化存储格式和机器学习友好性,激励了多项利用统计模型预测产后接触率影响因素的研究,推动了将健康指标与地理、社会经济变量结合的跨学科分析。部分工作还以此为基础,构建了针对非洲地区的时间序列预测框架,为健康监测提供了前瞻性工具。
数据集最近研究
最新研究方向
聚焦于非洲新生儿产后保健覆盖率的监测与预测,该数据集为评估非洲区域母婴健康干预效果提供了关键的量化依据。当前前沿研究多利用该指标结合机器学习模型,探索影响新生儿及时产后接触(出生后2天内)的社会经济与地理空间因素,例如整合WHO全球卫生观察站数据与非洲国家内部的不平等性分析。相关热点事件包括非洲联盟推动的《母婴健康加速计划》,该数据集被用于追踪“每个新生儿行动计划”的进展,尤其在撒哈拉以南非洲地区,其低水平覆盖率(低于40%)成为了全球健康公平性讨论的焦点。通过时间序列分析与多国对比,研究不仅揭示了2010至2017年间部分国家(如肯尼亚和加纳)的改善趋势,还量化了城乡差距对新生儿健康服务可及性的影响,为资源匮乏地区制定精准干预策略提供了实证支持。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务