five

electricsheepafrica/africa-who-antenatal-care-coverage-at-least-one-visit-sitpercent

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-antenatal-care-coverage-at-least-one-visit-sitpercent
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在2014年至2023年间,世界卫生组织全球健康观察站(WHO GHO)关于“至少一次产前检查覆盖率(百分比)”的指标数据。数据来源于WHO GHO的OData API,并以Parquet格式重新打包,具有一致的架构。所有数值均来自浮点精度字段(NumericValue),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low, value_high)。数据集覆盖40个非洲国家,总行数为88行,区域筛选为WHO AFRO(ParentLocationCode = AFR)。数据集还包含国家ISO3代码、WHO地区代码、观察年份、数值估计、显示字符串、维度类型和值等信息。

This dataset contains country-level observations for the WHO GHO indicator "Antenatal care coverage - at least one visit (percent)" (`ANC_ATLEAST1VISIT_PERCENT`) across African nations, spanning 2014–2023. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available. The dataset covers 40 African nations with a total of 88 rows, filtered by WHO AFRO region (`ParentLocationCode = AFR`). It includes columns such as country ISO3 code, WHO region code, observation year, numeric value estimate, display string, dimension types and values, and more.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区产前保健覆盖率中至少接受一次产前检查的百分比这一关键指标。数据以Parquet格式重新封装,确保架构一致性,仅采用浮点精度的数值字段作为核心目标变量,并附带置信区间上下界(若存在)。通过筛选WHO非洲区域代码,汇集了2014至2023年间40个非洲国家的88条年度观测记录,每条记录对应单一国家与年份的组合,未涉及次级维度分层。
特点
数据集的核心特色在于其针对非洲区域产前保健覆盖率的专一性,覆盖40个国家长达十年的时序数据,可为区域健康趋势分析提供高质量基础。架构中包含指示代码、国家ISO代码、WHO区域、年份、数值估计及其置信区间、显示字符串及元数据时间戳,结构严谨。由于无亚维度分层,每条记录代表特定国家与年份的全局估计,简化了多维度解析的复杂度,适合直接用于回归或分类预测任务。
使用方法
使用者可通过HuggingFace datasets库加载该数据集,调用load_dataset函数直接获取训练集,并转换为Pandas DataFrame以便操作。典型分析流程包括筛选特定性别或居住地类型的亚群(例如通过dim1字段过滤男女合计),或针对单一国家进行时间序列分析。鉴于数据包含置信区间,研究者可在建模中纳入不确定性信息,或聚焦于全国层面的估计展开预测与比较研究。
背景与挑战
背景概述
该数据集由世界卫生组织(WHO)全球卫生观测站(GHO)创建,经由Electric Sheep Africa项目在HuggingFace上重新整理发布,聚焦于非洲国家2014至2023年间至少接受一次产前保健服务的覆盖率(百分比)。核心研究问题在于量化非洲地区孕产妇健康服务的可及性,以监测《可持续发展目标》中关于降低孕产妇死亡率的进展。该数据集覆盖40个非洲国家,共88条记录,其结构化、机器可读的格式为流行病学建模与政策评估提供了关键基准,尤其对资源匮乏地区的母婴健康干预策略具有重要研究价值。
当前挑战
该数据集所解决的领域问题在于,非洲孕产妇保健覆盖率长期面临数据稀缺、指标不一致及时间序列不完整等挑战,导致难以精准评估干预效果。构建过程中的挑战包括:从WHO OData API中提取的数据需清洗并统一为标准模式,尤其是处理置信区间字段(value_low, value_high)的缺失问题,以及确保不同国家的数据在时间维度和亚组分类(如性别、居住地类型)上的可比性。此外,小样本量(n<1K)增加了统计建模的约束,需谨慎处理泛化偏差与外部效度问题。
常用场景
经典使用场景
在非洲孕产妇健康研究领域,该数据集被广泛用于分析非洲国家产前保健覆盖率的时空变化趋势。研究人员可基于2014至2023年间40个非洲国家的面板数据,通过时间序列分析或纵向比较方法,探究不同国家在至少接受一次产前保健服务方面的覆盖率动态。其简洁的表格结构,包含点估计值及置信区间,使得构建回归模型或分类任务变得高效,尤其适合评估卫生政策干预效果或预测未来覆盖率走向。
解决学术问题
该数据集的问世,有效填补了非洲区域产前保健指标在标准化、机器学习友好型公开数据上的空白。它解决了学术研究中数据来源分散、格式不一、难以跨年份比较的痛点,使研究者能够系统性地考察社会经济发展水平、卫生系统可及性等因素与产前保健覆盖率之间的关联。此外,置信区间信息为不确定性量化提供了可靠依据,推动了稳健统计方法和贝叶斯建模在公共卫生领域的应用,从而提升了区域健康评估的科学性与可信度。
衍生相关工作
基于该数据集,已衍生出多项经典研究及多模态数据集构建工作。例如,研究者将其与非洲国家经济指标、教育水平或疟疾发病率等数据集进行特征拼接,构建更全面的健康决定因素分析模型。此外,该数据集也被用于验证时序预测算法在稀疏面板数据上的表现,或作为迁移学习中预训练任务的数据源。Electric Sheep Africa系列中其他健康指标数据集也遵循类似模式,共同构成了一个可复用的非洲健康數據库,推动了跨指标联合分析与多任务学习的发展。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务