electricsheepafrica/africa-who-contraceptive-prevalence-use-of-modern-methods
收藏Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-contraceptive-prevalence-use-of-modern-methods
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)关于非洲国家现代避孕方法使用率(%)的指标数据,时间跨度为1993年至2019年。数据集是Electric Sheep Africa项目的一部分,该项目旨在提供一个统一的、适合机器学习使用的非洲数据仓库。数据直接从WHO Global Health Observatory的OData API获取,并以Parquet文件格式重新打包,所有数值均来自浮点精度字段(NumericValue),并包含可用的置信区间边界(value_low, value_high)。数据集覆盖了41个非洲国家,共5,813行数据,并提供了多个子维度(如年龄组、教育水平、居住地区类型等)以支持进一步的分析。
This dataset contains country-level observations for the WHO GHO indicator "Contraceptive prevalence - use of modern methods (%)" (`cpmowho`) across African nations, spanning 1993–2019. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available. The dataset covers 41 African nations with a total of 5,813 rows and includes various sub-dimensions (e.g., age group, education level, residence area type) for detailed analysis.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源于世界卫生组织全球卫生观察站(WHO GHO)的OData API,经Electric Sheep Africa团队系统化整合与再封装而成。数据收集聚焦于非洲联盟区域(WHO AFRO),涵盖1993年至2019年间41个非洲国家的现代避孕方法使用率指标。原始数据以Parquet格式存储,采用高度一致的列式架构,所有数值均直接取自API返回的浮点精度字段,并辅以置信区间上下限信息。数据集中的每条记录对应特定国家、年份及可能的分层维度组合,从而确保了结构清晰、便于机器学习的工业级可用性。
特点
该数据集最为显著的特点在于其精细的多维分层结构,包含年龄组、教育水平、居住地类型、财富十分位数与五分位数等子维度。这些维度使得研究者能够深入剖析不同社会群体间现代避孕方法使用率的差异,从而支持更为细化的因果推断或跨群体比较。此外,数据集具有明确的时间跨度与广泛的地理覆盖,而原始数据来源的权威性与公开许可协议(CC BY 4.0)则赋予了其极高的复用价值与学术可信度。
使用方法
数据集可通过HuggingFace的datasets库直接加载,调用load_dataset方法后即可将其转换为Pandas DataFrame进行分析。用户可根据研究目标进行灵活过滤:若需关注全国层面两性总体情况,可依据dim1字段过滤以排除细分群体;若需构建时间序列,则通过对country_iso3与year字段排序实现。数据集提供的主值value_numeric可直接作为机器学习或统计建模的目标变量,而置信区间字段有助于不确定性量化与结果稳健性检验。
背景与挑战
背景概述
该数据集由Electric Sheep Africa团队于2023年前后创建,源自世界卫生组织(WHO)全球卫生观察站(GHO)的官方指标“现代避孕方法使用率(%)”,聚焦非洲地区1993至2019年间41个国家的5,813条观测记录。作为“非洲数据统一机器学习就绪库”的重要组成部分,该数据集以Parquet格式重新封装,保留置信区间等元数据,旨在为公共健康领域提供标准化、高可用的结构化数据资源。其核心研究问题围绕非洲大陆现代避孕普及率的时空分布、细分维度(如年龄、教育、财富等级、城乡类型)及与人口健康政策的关联展开,为机器学习模型在区域卫生指标预测、不平等性分析及政策效果评估等方向提供了关键基础数据,对推动非洲生殖健康研究与循证决策具有显著影响力。
当前挑战
该领域面临的核心挑战在于:现代避孕普及率作为评估生殖健康服务可及性的关键指标,在非洲多数国家长期存在数据稀疏、年限不连续及细分维度差异显著的问题,传统统计方法难以有效建模复杂非线性关系。在构建过程中,数据整合面临多重困难:原始WHO OData API返回的庞杂JSON结构需统一解析为标准化模式;不同年代间的抽样方法、调查机构及亚组分类体系(如教育水平与财富等级的定义)存在异质性,可能导致跨时间比较的偏差;部分观测缺少置信区间或细分维度的完整标注,需在数据清洗时审慎处理缺失与异常值;此外,严格限定于WHO AFRO区域的筛选策略虽提升了区域聚焦度,却进一步压缩了样本数量,增加了模型泛化的不确定性。
常用场景
经典使用场景
在非洲公共卫生与人口健康研究领域,该数据集作为世界卫生组织全球卫生观察站(WHO GHO)官方指标的规范化整理版本,为研究者提供了一份高质量、机器学习就绪的纵向数据资源。其经典使用场景聚焦于利用覆盖1993至2019年、横跨41个非洲国家的国家层面观测值,构建时序预测模型以追踪现代避孕方法使用率的动态演变。同时,借助年龄组、教育水平、居住地类型及财富分位数等丰富的亚维度分层信息,研究者能够进行多维度交叉分析,深入剖析不同社会群体间避孕行为的差异与趋势,从而揭示公共卫生干预措施在不同人群中的实际效果。
衍生相关工作
围绕该数据集衍生了一系列具有影响力的相关工作。数据整理方Electric Sheep Africa通过将其纳入统一的非洲数据仓库,为跨数据集整合与迁移学习创造了便利条件。学术界已在相关研究中将该数据作为核心监督信号,用于训练时间序列模型预测撒哈拉以南非洲国家的避孕普及轨迹,并与世界银行关于女性教育、就业率的数据集联合分析,构建多变量因果推断框架。此外,基于该数据的亚维度结构,部分工作开发了面向不平等度量的小区域估计方法,有效量化了国家内部因财富和居住地差异带来的生殖健康服务可及性鸿沟。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区现代避孕方法普及率的时空演变与人口健康关联研究。当前前沿方向包括利用机器学习模型(如时序预测与分类算法)分析各国现代避孕使用率与教育水平、居住地类型、财富分位数等社会经济学维度的交互效应,揭示撒哈拉以南非洲地区在生殖健康服务可及性方面的结构性差异。结合世界卫生组织全球卫生观察站的数据源,研究者可追踪1993至2019年间41个非洲国家的避孕行为变迁,为联合国可持续发展目标中关于普遍获取性与生殖健康服务的指标监测提供量化支撑。数据集的分层特性(涵盖年龄组、性别、地理区域)使其成为评估区域卫生干预政策效果、识别边缘化群体覆盖缺口的理想工具,尤其在当前全球呼吁加强妇幼健康与生育权保障的议题下具有重要政策转化价值。
以上内容由遇见数据集搜集并总结生成



