five

electricsheepafrica/africa-who-demand-for-family-planning-satisfied-modern-and-traditional

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-demand-for-family-planning-satisfied-modern-and-traditional
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标计划生育需求满足率 - 现代和传统方法(%)(`fps`)在非洲国家的国家级观测数据,时间跨度为1993年至2019年。该数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO全球健康观察站OData API,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自`NumericValue`(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(`value_low`,`value_high`)。数据集涵盖40个非洲国家,总行数为5,528行,并包含多个子维度,如年龄组、教育水平、居住地区类型和财富十分位数/五分位数。

This dataset contains country-level observations for the WHO GHO indicator Demand for family planning satisfied - modern and traditional methods (%) (`fps`) across African nations, spanning 1993–2019. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available. The dataset covers 40 African nations, with a total of 5,528 rows, and includes various sub-dimensions such as age group, education level, residence area type, and wealth decile/quintile.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观测站(WHO GHO)的OData API,聚焦于非洲国家在1993至2019年间“通过现代与传统方法满足的计划生育需求百分比”这一核心指标。数据经过系统化整理与清洗,采用Parquet文件格式存储,并统一构建了标准化模式。所有观测值均直接取自数值型精度字段(NumericValue),而非显示字符串,同时尽可能保留了置信区间的上下限值。样本覆盖面涵盖40个非洲国家,共计5528条记录,并依据年龄组、教育水平、居住地类型、财富分位数等维度进行了分层细分,每一条记录对应国家、年份与特定维度的唯一组合。
特点
该数据集具备多维分层与高颗粒度的显著特点。它不仅提供了国家层面的总体估计值,还通过AGEGROUP、EDUCATIONLEVEL、RESIDENCEAREATYPE、WEALTHDECILE及WEALTHQUINTILE等子维度,揭示了不同人口群体内部的服务满足差异。数据模式上统一了indicator_code、country_iso3、year等关键字段,并专为机器学习任务设计了value_numeric作为目标变量,同时保留了value_display等辅助信息。这种设计既便于进行跨国家、跨时间的趋势分析,也支持针对特定亚群如城乡或不同教育背景人群的精细研究。
使用方法
用户可借助Hugging Face的datasets库便捷加载该数据集,通过执行load_dataset函数即可获取训练集,并轻松将其转换为Pandas DataFrame以便开展后续分析。在使用过程中,可通过筛选dim1字段中以“_BTSX”结尾的条目或直接过滤空值来获取全性别国家层面的数据。对于国别时间序列分析,可按country_iso3字段过滤特定国家并依据year排序。该方法兼顾了简洁性与灵活性,允许研究人员根据研究需要灵活聚合或细分不同维度的数据,从而高效支持回归或分类等下游任务。
背景与挑战
背景概述
该数据集由Electric Sheep Africa团队于2023年前后整理自世界卫生组织(WHO)全球卫生观测站(GHO)的开放数据,聚焦于非洲地区计划生育需求满足率(涵盖现代与传统方法)的百分比指标(fps)。数据集覆盖1993至2019年间40个非洲国家的5528条观测记录,按国家、年份、年龄组、教育水平、居住地类型及财富指数等多个维度分层呈现。作为Electric Sheep Africa统一非洲数据集系列的一部分,其核心目标是为机器学习研究提供经过标准化清洗、可直接用于分类与回归任务的表格数据。该数据集整合了WHO权威统计与细粒度分层特征,为非洲生殖健康政策的量化评估提供了坚实的数据基础,对监测可持续发展目标(SDGs)中性与生殖健康相关指标具有重要参考价值。
当前挑战
该数据集所解决的领域问题主要围绕非洲地区计划生育服务的可及性与使用效率评估,核心挑战在于如何利用有限的国家级分层数据精准建模需求满足率,以支持政策制定者识别服务覆盖的薄弱环节。在构建过程中,面临多重挑战:首先,原始数据来自WHO的OData API,需对多源异构指标进行统一架构清洗与类型转换,确保数值精度与置信区间字段的完整性;其次,不同年份与国家间的数据稀疏性显著,部分子维度(如财富十分位数、DHSS地理区域)存在大量缺失或非连续记录;此外,维度组合(如年龄组×教育水平×居住地)导致观测行数膨胀,需设计合理的过滤与聚合策略以平衡细粒度与样本代表性,避免过度稀疏引发的模型偏差。
常用场景
经典使用场景
该数据集聚焦于非洲地区计划生育需求满足率的追踪,涵盖现代与传统避孕方法的使用比例。其经典应用在于构建时间序列预测模型,以评估各国在1993至2019年间计划生育服务的覆盖变化趋势。通过整合国家、年龄、教育水平、居住地类型及财富五分位等多维分层特征,研究人员能够精细刻画不同亚群间的差异,并利用置信区间进行不确定性建模。数据以标准化Parquet格式存储,并兼容HuggingFace的datasets库,便于直接加载至机器学习流水线中,进行回归分析或分类任务,例如预测需求未满足的高风险区域。
衍生相关工作
该数据集衍生出的经典工作包括基于机器学习的非洲计划生育需求预测模型,研究者常利用其时间序列特性开发递归神经网络或梯度提升模型,以预估未来需求波动。同时,它催生了一系列与Electric Sheep Africa其他数据集的融合分析,例如结合疾病负担或卫生系统数据,探究计划生育与儿童健康指标间的关联。此外,该数据集推动了公平性评估研究,通过财富五分位分层,衍生出衡量避孕服务覆盖不平等程度的指数计算工作。其开放获取特性也促成了复现性研究的基准构建,尤其是对WHO全球健康观察站原始数据的清洗管道和元数据标准化流程,为跨数据集迁移学习提供范例。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区现代与传统避孕方法满足计划生育需求的百分比,反映了全球公共卫生领域在性健康与生殖健康方面的前沿动态。近年来,随着联合国可持续发展目标中关于普遍获得生殖健康服务的推进,该数据被广泛用于评估非洲各国计划生育政策的有效性与公平性,特别是在年龄、教育水平、居住地域及财富阶层等细分维度下的差异分析。结合WHO全球卫生观测站的高频更新,研究者可通过该数据集追踪1993年至2019年间非洲40国的长期趋势,挖掘社会经济因素与避孕需求满足率之间的关联,从而为优化资源配置、缩小服务覆盖鸿沟提供数据驱动的决策依据。该数据集作为机器学习就绪的标准化资源,亦推动了可解释AI模型在公共卫生不平等问题上的创新应用,呼应了全球对数据赋能健康治理的迫切需求。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务