electricsheepafrica/africa-who-number-of-maternal-deaths
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-number-of-maternal-deaths
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察指标孕产妇死亡数量(MORT_MATERNALNUM)在非洲国家的国家级观察数据,时间跨度为1985年至2023年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO全球健康观察OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。
This dataset contains country-level observations for the WHO GHO indicator Number of maternal deaths (MORT_MATERNALNUM) across African nations, spanning 1985–2023. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
本数据集来源于世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区1985至2023年间孕产妇死亡数量的国家级观测数据。原始数据经过系统性整合,转换为Parquet格式文件存储,并采用统一的schema结构。所有数值均取自精确浮点字段NumericValue,而非展示字符串,同时保留置信区间上下限(value_low、value_high)以支持统计分析。数据集涵盖47个非洲国家,共计1833条记录,所有观测均通过WHO AFRO区域代码(ParentLocationCode='AFR')进行过滤筛选。
特点
该数据集具有鲜明的结构化特征:每一条观测对应一个国家与年份的组合,无额外子维度分层,确保了数据的简洁性。核心字段包括indicator_code、country_iso3、who_region、year、value_numeric及其置信区间,同时包含dim1_type/dim1和dim2_type/dim2等备选维度字段,以兼容可扩展性。所有数据均遵循CC BY 4.0许可协议发布,兼具开放性与规范性。数据规模处于1K至10K之间,适合作为非洲地区健康议题的机器学习和统计分析基础资源。
使用方法
研究者可通过HuggingFace的datasets库直接加载该数据集,示例命令为load_dataset('electricsheepafrica/africa-who-number-of-maternal-deaths'),并转换为Pandas DataFrame进行后续操作。若仅需全国层面的两性数据,可按dim1字段末位为'_BTSX'或为空的条件进行过滤。如需分析特定国家的时间序列,例如肯尼亚,可利用country_iso3字段筛选并依年份排序,从而开展纵向趋势建模与回归分析。
背景与挑战
背景概述
孕产妇死亡数量是衡量全球母婴健康水平与卫生系统效能的核心指标,尤其在撒哈拉以南非洲地区,该数据长期被视为追踪可持续发展目标(SDG 3.1)进展的关键依据。由世界卫生组织全球卫生观察站(WHO GHO)维护并经由Electric Sheep Africa团队整理发布的“非洲孕产妇死亡数量”数据集,覆盖1985至2023年间47个非洲国家的年度观测值,总计1833条记录,旨在为机器学习与公共卫生研究提供标准化、清洁且可直接用于建模的非洲健康数据资源。该数据集以CC BY 4.0许可开放,其构建不仅填补了非洲地区高质量、结构化健康数据的空白,还通过统一架构与Parquet格式的优化,显著降低了数据探索的门槛,为跨区域时序列分析、预测建模及政策评估奠定了坚实的数据基础。
当前挑战
数据集所应对的核心领域挑战在于,非洲大陆长期面临孕产妇死亡数据稀疏、报告不一致及时间序列不连续的问题,严重制约了基于数据的精准干预与SDG进展监测;该数据集通过整合WHO官方渠道的权威指标并统一清洗为机器学习就绪格式,试图弥合数据缺口。在构建过程中,面临的挑战包括:原始数据来自多国分散的卫生统计系统,部分国家缺失关键年份的观测值或置信区间信息;需处理多源非结构化字段(如显示字符串与数值型指标的映射)并确保跨地区、长时间跨度的数据一致性;此外,要忠实保留WHO规定的亚维度分层(如性别、城乡分类)信息,同时为下游建模提供灵活的过滤与聚合能力,这对数据管道的鲁棒性和可复现性提出了严苛要求。
常用场景
经典使用场景
在公共卫生与流行病学研究中,africa-who-number-of-maternal-deaths数据集被广泛应用于孕产妇死亡的时空分布与趋势分析。研究者可借助该数据集追踪1985至2023年间47个非洲国家孕产妇死亡数的年度变化,识别高负担国家与区域热点,并评估干预措施在时间序列上的效果。其规范的列式结构与清晰的年份和国家编码,使得构建预测模型、开展面板数据回归分析或进行多层次贝叶斯推断成为可能,是非洲孕产妇健康计量研究的基石数据源。
衍生相关工作
基于该数据集,衍生了一系列推动孕产妇健康领域发展的经典工作。例如,研究者结合地理空间数据构建了非洲孕产妇死亡热力图,揭示了撒哈拉以南地区的集中性高发格局;另有工作利用时间序列模型预测未来五年死亡趋势,为政策制定提供前瞻性参考。在模型层面,该数据集被用于训练基于梯度提升树的预测模型,识别高死亡风险的国家特征组合。此外,多篇系统综述与元分析将其作为核心数据源,系统评估了非洲孕产妇死亡率的长期变化及其社会经济决定因素。
数据集最近研究
最新研究方向
非洲孕产妇死亡数据集的构建与前沿应用正深刻重塑全球健康治理格局。基于世界卫生组织全球卫生观察站的官方指标,该数据集系统整合了1985至2023年间47个非洲国家的孕产妇死亡人数,并以机器学习友好格式呈现,为跨时空流行病学建模提供了坚实的数据底座。当前,研究人员正借助此类细粒度时间序列数据,结合地理空间分析与因果推断方法,探究冲突、气候变迁及卫生系统韧性对母婴健康的复合影响。该数据集的出现极大弥合了非洲健康大数据在AI领域的空白,推动着联合国可持续发展目标中降低孕产妇死亡率这一紧迫议题向着量化预警与精准干预的方向迈进。
以上内容由遇见数据集搜集并总结生成



