five

electricsheepafrica/africa-who-women-of-reproductive-age-who-have-their-need-for-family

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-women-of-reproductive-age-who-have-their-need-for-family
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在2000年至2023年间,关于15-49岁育龄妇女使用现代方法满足计划生育需求的比例的WHO GHO指标数据(指标代码:SDGFPALL)。数据来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,包含数值估计值、置信区间边界(如可用)以及格式化显示字符串。数据集是Electric Sheep Africa项目的一部分,该项目是一个统一的、适合机器学习使用的非洲数据存储库。

This dataset contains country-level observations for the WHO GHO indicator Women of reproductive age (aged 15-49 years) who have their need for family planning satisfied with modern methods (%) (SDGFPALL) across African nations, spanning 2000–2023. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区育龄女性(15-49岁)通过现代方法满足计划生育需求的比例(SDGFPALL)。数据经系统化采集与重构,以Parquet格式存储,统一采用浮点精度字段NumericValue作为核心指标值,并完整保留了置信区间上下界。覆盖2000至2023年间46个非洲国家的206条观测记录,每行对应国家、年份与维度的唯一组合,经WHO AFRO区域过滤后确保了地域聚焦性。
特点
数据集具有高度的结构化与可用性。其模式包含indicator_code、country_iso3、who_region、year等13个字段,清晰标识了观测维度与数值。特别设计了dim1_type和dim1等列以处理按性别或居住地类型分层的子维度,支持精细筛选。数值精度高,且部分观测附带置信区间,提供了统计稳健性。整体规模紧凑,便于快速加载与探索,是机器学习就绪的非洲健康数据宝库。
使用方法
用户可通过HuggingFace的datasets库直接加载数据集,调用load_dataset函数即可获得包含训练集的Dataset对象。随后可转换为Pandas DataFrame进行分析。推荐按dim1字段过滤出全国级别的两性综合数据,或通过country_iso3列按国家筛选时间序列,例如筛选肯尼亚数据并按年份排序。数据集天然支持分类与回归任务,适合用于预测模型构建或趋势评估,操作简洁,接口统一。
背景与挑战
背景概述
在全球公共卫生领域,满足育龄女性(15-49岁)的现代避孕需求是衡量生殖健康服务可及性与可持续发展目标(SDGs)进展的核心指标。世界卫生组织(WHO)全球卫生观察站(GHO)系统长期监测此指标,但原始数据分散、格式多样,限制了其在机器学习与跨区域分析中的直接应用。为此,由Electric Sheep Africa团队于2023年系统整理并发布的本数据集,聚焦非洲46国2000至2023年的SDGFPALL指标(现代避孕方法满足率),数据源自WHO官方OData API并统一转化为Parquet格式。该数据集填补了非洲区域高质量、结构化生殖健康数据集的空白,为政策制定者、流行病学家和机器学习研究者提供了可直接建模的标准化资源,有力推动了非洲大陆实现全民健康覆盖(UHC)与性别平等目标的循证决策。
当前挑战
该数据集所解决的核心领域挑战在于:非洲地区育龄女性现代避孕需求满足率的精确评估常受限于数据稀疏、质量参差不齐,且各国统计口径与时间跨度不一,导致传统宏观分析难以捕捉细微差异和时空动态。构建过程中面临多重挑战:其一,数据获取须从WHO GHO的复杂分层API中提取并过滤,涉及46个国家、24年跨度的混合性数据结构,需处理缺失值、置信区间异常及重复维度编码;其二,跨国家与年代的指标一致性维护困难,例如不同时期对“现代方法”的定义变迁与报告偏差;其三,将非结构化展示字符串(如"58.3 [57.7–59.0]")无损转换为浮点数值及置信区间,精度控制与异常剔除需谨慎设计,以确保机器学习任务的数据可靠性。
常用场景
经典使用场景
该数据集的核心用途在于评估非洲地区育龄女性(15-49岁)对现代避孕方法的可及性与满意度,从而量化‘计划生育需求满足率’这一关键健康指标。研究人员常将其作为目标变量,结合国家层面的社会经济、教育或卫生系统数据,构建回归或分类模型,以解析该指标在非洲46国间随时间推移的演变规律。数据集的时间跨度覆盖2000至2023年,为纵向趋势分析提供了坚实基础,尤其适用于探究哪些宏观因素推动了生育自主权的提升或阻碍了现代避孕方法的普及。通过引入置信区间字段,研究还可进一步评估估计值的不确定性,增强统计推断的可靠性。
实际应用
在实际应用中,该数据集为国际发展机构、公共卫生决策者及非政府组织提供了精准的监测与评估工具。通过预测模型,项目管理者可以识别出现代避孕方法普及率异常低下或波动剧烈的国家与年份,从而优先分配资源、针对性开展健康教育或优化供应链管理。数据集的时间序列特性还使其能够应用于干预效果的准实验评估,例如分析某项国家家庭规划政策实施前后,满足率的变化轨迹。此外,结合地理空间信息,这些数据可用于绘制非洲大陆的避孕服务覆盖热力图,辅助世界卫生组织、联合国人口基金等机构制定区域健康战略,最终推动女性生育自主权的实质性提升。
衍生相关工作
该数据集的推出催生了一系列衍生研究工作,尤其在机器学习与公共健康交叉领域表现活跃。其中经典工作包括:基于该指标与母婴死亡率、女性教育程度等数据的联合分析,构建多任务学习模型以揭示家庭规划与其他健康目标的协同效应;利用该数据集作为基准,对比不同时间序列预测模型(如Prophet、LSTM和贝叶斯结构时间序列)在低样本量非洲国别数据上的表现差异;以及通过可解释性方法(如SHAP值)识别影响需求满足率的关键预测因子,为政策干预提供透明化的优先级排序。这些工作不仅验证了数据集在ML-ready格式下的易用性,也推动了非洲健康大数据生态中标准基准的建立。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务