five

electricsheepafrica/africa-who-antenatal-care-coverage-at-least-four-visits-whs4154

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-antenatal-care-coverage-at-least-four-visits-whs4154
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家WHO GHO指标产前护理覆盖率 - 至少四次访问(%)(WHS4_154)的国家级观测数据,时间跨度为1990年至2024年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集覆盖了47个非洲国家,共254行数据。

This dataset contains country-level observations for the WHO GHO indicator Antenatal care coverage - at least four visits (%) (WHS4_154) across African nations, spanning 1990–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available. The dataset covers 47 African nations with a total of 254 rows.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦非洲地区孕产妇保健覆盖率指标“至少接受四次产前检查的比例”(WHS4_154)。数据集以Parquet文件格式重新封装,采用一致的列式存储结构,统一提取API中的NumericValue字段作为浮点精度的主要观测值,并保留置信区间上下界(value_low和value_high)以供后续分析。数据覆盖1990年至2024年间47个非洲国家,共计254条记录,通过ParentLocationCode='AFR'筛选确保区域一致性,最终形成面向机器学习的即用型表格数据仓库。
使用方法
使用者可通过HuggingFace的datasets库轻松加载该数据集,调用load_dataset()函数即可获取训练集(train split),并直接转换为Pandas DataFrame进行操作。建议在分析时先依据dim1字段筛选出“两性”(BTSX)或缺失值的国家层面数据,以确保结果代表全国总体水平。对于时序分析,可按国家代码(country_iso3)分组并排序年份,从而追踪特定国家产前保健覆盖率的动态变化趋势。
背景与挑战
背景概述
该数据集由Electric Sheep Africa团队整理,源自世界卫生组织全球卫生观测站(WHO GHO),聚焦非洲地区至少接受四次产前保健检查的覆盖率(指标代码WHS4_154),时间跨度涵盖1990年至2024年。产前保健覆盖率是评估孕产妇健康服务可及性与质量的关键指标,尤其对非洲地区而言,降低孕产妇和新生儿死亡率仍是重大公共卫生挑战。该数据集整合了47个非洲国家的标准化观测数据,以统一架构和Parquet格式提供,为机器学习驱动的健康政策研究、区域比较和时间序列分析奠定了坚实基础。通过开放许可协议,该数据集显著降低了非洲卫生数据的使用门槛,推动了数据驱动的全球健康研究。
当前挑战
该数据集旨在应对两大挑战。其一,非洲地区孕产妇健康领域长期面临数据稀疏、质量不均的问题,许多国家因基础设施薄弱导致产前保健覆盖率数据缺失或记录不完整,阻碍了精准的跨区域比较和趋势分析。该数据集通过整合WHO官方来源,提供了相对标准化的时间序列数据,但部分国家仍存在年份间数据断裂或置信区间缺失的情况,影响模型训练的可靠性。其二,数据集构建过程中需克服多源数据一致性挑战,包括处理不同年份的指标定义差异、维度(如性别或居住地区)的缺失或错误编码,以及从展示字符串中提取数值时的精度损失问题,最终通过保留浮点字段和置信区间边界值来提升数据可用性。
常用场景
经典使用场景
在非洲区域卫生监测与孕产妇保健研究的广阔图景中,该数据集作为一项关键指标被广泛采用,其最经典的用途在于评估非洲各国孕产妇保健服务的可及性与利用水平。通过追踪至少四次产前检查覆盖率的纵向变化,研究者得以系统刻画非洲大陆在实现可持续发展目标中降低孕产妇死亡率方面的进展与挑战。该数据集以国家为分析单元,覆盖1990年至2024年的长时间跨度,为时空动态分析提供了珍贵的统计基础。其结构化的列式设计包含点估计值及其置信区间,既便于直接输入传统回归模型,也兼容机器学习算法自动挖掘时间序列中的隐含模式,从而支撑起对产前保健服务覆盖趋势的定量刻画与跨国比较。
解决学术问题
在学术研究层面,该数据集有效回应了长期以来困扰全球健康领域的非洲孕产妇保健数据碎片化与不可比难题。通过整合世界卫生组织全球卫生观察站的官方统计,它构建了一个清洁、规范且具备机器学习友好的数据基础设施,使得研究者能够聚焦于识别产前保健覆盖不平等的社会经济决定因素与地理分布差异。该数据集所支撑的典型问题包括:孕产妇保健服务覆盖率随时间的演变规律及其与国家卫生系统投入的关联,以及政策干预或外部援助对覆盖提升的因果效应评估。这一工作的意义在于,为循证决策提供了可靠的数据锚点,推动了非洲卫生政策研究中从描述性统计向预测模型与因果推断的范式跃迁。
实际应用
在实际应用层面,该数据集为非洲区域内的公共卫生决策与资源调配提供了切实可行的量化工具。国际组织与各国卫生部门可借助其国家层面的覆盖率走势,精准识别出产前保健服务薄弱的地区与时段,从而合理配置流动诊所、培训助产人员或扩展社区健康教育网络。非政府机构在进行项目成效评估时,亦能以此数据集为基线,对比干预地区与全国平均水平的差距,量化自身工作的边际贡献。此外,该数据集的机器可读格式使其能够无缝嵌入预警系统,当某国产前检查覆盖率出现异常下降时,系统可自动触发风险提示,为快速响应机制的启动赢得宝贵时间。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区至少四次产前保健覆盖率的追踪,是评估全球母婴健康进展的核心指标之一。在当下,世界卫生组织正积极推动‘到2030年降低孕产妇死亡率’的可持续发展目标,而产前保健覆盖率正是衡量干预可及性与卫生系统效能的关键标尺。该数据集的发布,为机器学习模型在高缺失率、时空分布不均的非洲健康数据上开展预测与归因分析提供了标准化、可复现的基础——研究者可借此探索国家政策、经济水平与传染病负担如何共同塑造产前保健的时空异质性。其Parquet格式与置信区间字段的设计,更是直指当前健康统计中痛点:如何在有限样本下稳健推断趋势并量化不确定性,这一工作对资源匮乏地区的卫生规划具有实质参考意义。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务