five

electricsheepafrica/africa-who-uhc-service-coverage-sub-index-on-reproductive

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-uhc-service-coverage-sub-index-on-reproductive
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在2000年至2023年间关于UHC服务覆盖子指数,涉及生殖、孕产妇、新生儿和儿童健康(UHC_SCI_RMNCH)的国家级观测数据。数据来源于世界卫生组织(WHO)全球健康观察站(GHO)的OData API,并以Parquet文件格式重新打包,包含数值型数据和置信区间。数据集覆盖47个非洲国家,共1,128行数据。该数据集是Electric Sheep Africa项目的一部分,旨在提供一个统一的、适合机器学习使用的非洲数据存储库。

This dataset contains country-level observations for the WHO GHO indicator UHC Service Coverage sub-index on reproductive, maternal, newborn and child health (UHC_SCI_RMNCH) across African nations, spanning 2000–2023. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
本数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区全民健康覆盖(UHC)服务覆盖指数中关于生殖、孕产妇、新生儿及儿童健康的子指标(UHC_SCI_RMNCH)。原始数据经过标准化处理与重新封装,以Parquet格式存储,并严格采用浮点精度字段NumericValue作为核心数值,同时保留了置信区间上下限。数据覆盖2000年至2023年间47个非洲国家的1128条观测记录,所有观测均限定于WHO非洲区域(AFR),通过统一的数据Schema构建为机器学习就绪的表格数据集。
特点
该数据集具有鲜明的时空连续性与结构化特征,时间跨度为24年,空间覆盖47个非洲国家,为纵向比较与跨国分析提供了丰富的数据基础。每条观测值均包含点估计及置信区间,便于评估统计稳定性。数据集中特别标注了维度类型(如性别、居住地类型)及其取值,支持分层分析与聚合计算。此外,数据采用一致的字段命名规范,如indicator_code、country_iso3、year等,极大提升了不同指标间的可互操作性与复用性。
使用方法
用户可通过HuggingFace Datasets库轻松加载数据集,调用load_dataset函数即可获取训练集,并转换为Pandas DataFrame进行后续分析。为聚焦于全国层面的两性综合指标,建议通过筛选dim1字段中结尾为_BTSX或为空的行来提取国家总体估计值。同时,可通过country_iso3字段对特定国家进行时间序列提取,例如筛选肯尼亚(KEN)所有年份的数据并排序。对于需要分层分析的研究,可依据dim1与dim2字段选择特定亚组,如城乡或性别维度,以实现精准建模与评估。
背景与挑战
背景概述
该数据集源自世界卫生组织(WHO)全球卫生观察站(GHO),由Electric Sheep Africa团队在2023年整理并发布,聚焦非洲47个国家在生殖、孕产妇、新生儿和儿童健康方面的全民健康覆盖(UHC)服务覆盖子指数(UHC_SCI_RMNCH)。作为非洲地区健康数据的重要标准化资源,它覆盖2000至2023年间的国家年度观测值,为评估非洲大陆在可持续发展目标(SDG)中的健康进展提供了关键量化基础。该数据集以机器学习(ML)友好的Parquet格式重新封装,并公开于HuggingFace平台,显著降低了非洲卫生健康数据的获取门槛,推动了跨境健康指标分析与政策模拟的研究应用。
当前挑战
该数据集面临多重挑战:首先,其解决的领域问题是非洲地区生殖与儿童健康服务覆盖评估中数据稀疏、口径不一致的困境,使得各国基于UHC子指数的横向比较与纵向趋势分析缺乏统一可靠的基准。其次,构建过程中遭遇数据质量挑战,原始WHO数据存在缺失值、置信区间不稳定以及部分年度数据点不连续的问题;同时,整合47个国家的跨时间序列数据时,需要处理地区编码差异、维度分类标准(如性别、城乡)不统一及更新时间不一致等技术障碍,确保机器学习模型的输入具有稳健性和可复现性。
常用场景
经典使用场景
该数据集聚焦于非洲47个国家在2000至2023年间,针对生殖、孕产妇、新生儿及儿童健康的全民健康覆盖(UHC)服务覆盖子指数。其经典应用在于作为面板数据,进行时间序列分析或跨国家横截面比较。研究者可借此追踪特定国家在妇幼健康服务覆盖上的长期趋势,或评估区域整体进展,为循证政策制定提供量化依据。
解决学术问题
该数据集有效回应了在非洲公共卫生研究中长期存在的核心难题:评估全民健康覆盖在妇幼领域的具体实现程度。它解决了以往数据分散、标准不一的问题,通过提供跨国家、跨年度的标准化指数,使学者能够系统分析覆盖率的区域差异、时间演变及其健康结果的影响。这对揭示卫生系统绩效、资源分配不均等学术问题具有深远意义。
衍生相关工作
基于该数据集,研究者已开展多项经典工作,包括构建面板回归模型探索UHC覆盖与经济、教育等指标的关联,利用机器学习预测未来服务覆盖缺口,以及将数据与DHS、MICS等调查结合进行多源验证。此外,它也为世界卫生组织年度全球监测报告提供了非洲地区的关键输入,催生了关于非洲卫生公平性的实证研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作