five

electricsheepafrica/africa-who-women-who-have-their-need-for-family-planning-satisfied

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-women-who-have-their-need-for-family-planning-satisfied
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在2000年至2026年间,世界卫生组织全球健康观察站(WHO GHO)关于使用现代方法满足计划生育需求的女性比例(%)的指标数据(指标代码:FAMILYPLANNINGUNPDUHC)。数据来源于WHO GHO OData API,并以Parquet文件格式重新打包,包含数值估计(value_numeric)和置信区间(value_low, value_high)等信息。数据集是Electric Sheep Africa项目的一部分,该项目是一个统一的、适合机器学习使用的非洲数据存储库。数据集覆盖46个非洲国家,总行数为3,618行,包含国家代码、年份、数值估计、显示字符串、维度类型和值等字段。

This dataset contains country-level observations for the WHO GHO indicator Women who have their need for family planning satisfied with modern methods (%) - modelled estimates (FAMILYPLANNINGUNPDUHC) across African nations, spanning 2000–2026. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available. The dataset covers 46 African nations with a total of 3,618 rows, and includes fields such as country code, year, numeric value, display string, dimension types and values.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区育龄女性通过现代方法满足计划生育需求的比例(%)的模型估算值。研究者将原始API中的`NumericValue`字段作为核心数值,同时保留置信区间上下限(`value_low`、`value_high`),并以Parquet格式统一封装,确保数据在一致的模式下可供机器学习直接使用。数据集覆盖2000至2026年间46个非洲国家的3618条观测记录,每行对应国家、年份及各子维度的唯一组合。
特点
该数据集具有鲜明的结构化特征,包含`indicator_code`、`country_iso3`、`who_region`、`year`、`value_numeric`等关键字段,并提供`dim1`与`dim2`列以容纳性别、居住地类型等子维度分层信息。所有观测值均来自浮点精度的数值字段而非显示字符串,提升了建模精度。置信区间信息的嵌入,为不确定性量化与稳健性分析提供了便捷支持。数据集整体经过区域过滤,仅保留WHO非洲区域(AFR)的国家,确保了地理一致性。
使用方法
使用者可通过HuggingFace的`datasets`库轻松加载该数据集,并利用`to_pandas()`方法转换为DataFrame进行后续分析。为获取国家级且不限性别的基线数据,可基于`dim1`字段筛选以`_BTSX`结尾或缺失的行。若需对特定国家(如肯尼亚)进行时间序列分析,可通过`country_iso3`列过滤并依`year`排序。数据集支持按子维度聚集或跨层聚合,适应多元回归、分类及健康指标预测等机器学习任务。
背景与挑战
背景概述
在现代公共卫生领域,衡量女性对现代避孕方法的满意度是评估生殖健康服务可及性与质量的核心指标之一。世界卫生组织(WHO)通过全球卫生观察站(GHO)长期收集并发布相关数据,其中“使用现代方法满足计划生育需求的女性比例”这一指标(代码FAMILYPLANNINGUNPDUHC)被视为可持续发展目标(SDGs)监测的关键组成部分。由Electric Sheep Africa团队整理并发布的该数据集,整合了2000年至2026年间46个非洲国家的官方统计与模型估计值,覆盖3618条观测记录,旨在为机器学习与数据科学社区提供一个统一、标准化且可直接用于预测建模的非洲健康数据资源。该数据集不仅保留了WHO提供的点估计值及其置信区间,还通过一致的列式模式(Parquet格式)简化了跨国家、跨时间的纵向分析,为研究非洲大陆计划生育服务覆盖的动态变化及其驱动因素奠定了坚实的数据基础。
当前挑战
该数据集所面对的挑战首先源于其核心研究领域——在资源相对匮乏的非洲地区,准确度量女性计划生育需求满足率面临多重障碍。一方面,传统调查数据受限于样本代表性、回忆偏倚及跨文化对“需求”定义的差异,导致原始观测值存在系统性误差;另一方面,模型估计虽能填补数据空白,但不同估算方法(如贝叶斯层次模型)在置信区间的宽度与稳定性上差异显著,增加了跨时间、跨国比较的不确定性。在数据构建过程中,挑战同样显著:来自GHO OData API的原始数据需经严格的清洗与转换,包括处理多个亚维度(如性别、居住区域类型)带来的重复行问题、不同年份之间国家代码与变量命名规则的不一致性,以及因部分年份或国家缺失置信区间下限/上限值而导致的稀疏性。此外,将显示字符串(如“58.3 [57.7–59.0]”)中的数值准确解析为浮点型字段,并确保与原始NumericValue字段对齐,亦要求细致的验证流程,以避免精度损失或错误匹配。
常用场景
经典使用场景
该数据集作为世界卫生组织全球卫生观察站(GHO)的权威指标之一,聚焦于非洲地区女性通过现代方法满足计划生育需求的百分比估计值。在公共健康与人口学研究领域,它常被用于构建时间序列预测模型,分析2000年至2026年间46个非洲国家在计划生育服务覆盖上的变化趋势。研究者能够借助该数据集开展区域间比较分析,评估不同国家在实现可持续发展目标(尤其是目标3.7:确保人人享有性与生殖健康服务)方面的进展。同时,数据集纳入的置信区间为不确定性量化提供了基础,使其适用于贝叶斯统计推断与稳健性检验等高级分析场景。
实际应用
在实际应用层面,该数据集为国际组织、非洲各国卫生部门及非政府组织提供了关键决策依据。例如,联合国人口基金(UNFPA)和世界银行在制定区域健康援助策略时,可基于这些估计值识别计划生育服务薄弱的“热点”国家与时段,从而精准分配资源。此外,机器学习工程师可将该数据集整合进医疗健康领域的预测平台,构建面向非洲的计划生育需求预警系统,实时追踪服务覆盖率的波动。对于本地政策制定者而言,多年份的纵向数据也有助于评估国家健康计划的实施效能,并调整干预措施的优先级。
衍生相关工作
围绕该数据集,学术界已衍生出一系列经典工作。基于GHO框架的计划生育指标,多项研究采用多层次模型或结构方程模型,探讨了城市化率、宗教信仰与女性自主权对现代避孕方法采纳率的影响。在人工智能领域,有团队利用该数据训练了面向非洲健康指标的缺失值插补模型,显著提升了跨国家面板数据的完整性。此外,Electric Sheep Africa项目本身构成了一个标志性的数据基础设施工作,它将分散的WHO原始数据重塑为机器学习友好的格式,催生了若干关于非洲健康数据标准化与可复现性的方法论论文。这些衍生工作共同强化了该数据集作为非洲公共卫生定量研究基石的地位。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务