electricsheepafrica/africa-who-contraceptive-prevalence-modern-and-traditional-methods
收藏Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-contraceptive-prevalence-modern-and-traditional-methods
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家在1993年至2019年间,世界卫生组织全球健康观察站(WHO GHO)关于现代和传统避孕方法普及率(%)的指标数据。数据来源于WHO Global Health Observatory OData API,并以Parquet文件的形式重新打包,包含数值型数据和置信区间。数据集是Electric Sheep Africa项目的一部分,该项目是一个统一的、适合机器学习使用的非洲数据存储库。
This dataset contains country-level observations for the WHO GHO indicator Contraceptive prevalence - modern and traditional methods (%) (`cpmt`) across African nations, spanning 1993–2019. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的开放数据接口,聚焦非洲地区现代与传统避孕普及率这一关键公共卫生指标。数据经过系统性重构,从OData API中抽取数值型观测值(NumericValue),而非显示字符串,并整合为统一的Parquet格式文件。构建过程中保留了置信区间上下界(value_low, value_high),同时纳入年龄组、教育水平、居住地类型、财富分位数等多维度分层变量,每条记录对应国家、年份与特定分层的唯一组合,形成结构清晰、机器友好的表格化数据集。
使用方法
数据集以HuggingFace Datasets库的格式发布,可通过load_dataset函数一键加载为pandas DataFrame。用户可利用dim1和dim2字段进行维度筛选,例如通过过滤SEX_BTSX或空值获取两性总体国家层数据。针对特定国家(如肯尼亚),可结合country_iso3列与year列进行时间序列提取。数据适用于分类与回归任务,点估计值(value_numeric)作为主要目标变量,置信区间列则可用于不确定性量化或模型评估场景。
背景与挑战
背景概述
该数据集由Electric Sheep Africa团队于2023年整合自世界卫生组织(WHO)全球卫生观察站(GHO)的公开数据,聚焦于非洲国家现代与传统避孕方法使用率的时空分布。核心研究问题在于系统揭示1993至2019年间42个非洲国家避孕普及率的动态演变规律,为公共卫生政策制定与机器学习建模提供结构化、标准化且可复现的数据基础。作为WHO官方指标cpmt的ML就绪版本,其覆盖年龄组、教育水平、居住地类型及财富等级等多维分层信息,显著提升了非洲生殖健康领域数据挖掘的颗粒度与可分析性,对全球健康不平等研究、人口动态预测及可持续发展目标监测具有直接推动作用。
当前挑战
该数据集所应对的领域挑战在于填补非洲大陆避孕普及率细粒度时空数据的系统性缺失。传统调查数据常受限于国家间统计口径不一、时间序列碎片化及分层变量缺失,难以支撑跨区域比较与趋势建模。其构建过程中需处理WHO原始API中嵌套的分层结构、不同年份维度的不一致编码以及置信区间字段的大量空值,同时需将异构的显示字符串解析为数值型指标,并统一转化为Parquet格式的兼容模式,确保5831条记录在年龄、财富五分位等15个子维度上的逻辑一致性与ML模型的直接可计算性。
常用场景
经典使用场景
在非洲公共卫生研究领域,现代与传统避孕方法的普及率是评估生殖健康服务成效的关键指标。该数据集最经典的使用场景是构建回归模型,用以预测不同非洲国家在特定年份的避孕普及率,进而揭示区域间的人口健康差异。研究者可利用其中的国家、年份、年龄组、教育水平、居住地类型和财富五分位数等多维特征,对避孕普及率进行精细化建模。诸如时间序列预测任务,可以基于历史数据预测未来的趋势变化,为公共健康政策的制定提供数据驱动支持。此外,分类场景同样适用,例如依据特征组合将国家划分为高、中、低避孕普及率类别,以便识别需要重点干预的区域。这一数据整合了世界卫生组织全球健康观察站的权威信息,形成了机器学习就绪的结构化资源,大幅降低了非洲健康大数据研究的门槛。
解决学术问题
该数据集直接回应了非洲生殖健康研究中的两大核心学术问题:一是缺乏统一、标准化的跨国家纵向对比数据,二是难以量化社会人口学因素对避孕行为的影响。通过提供覆盖42个非洲国家、跨越1993年至2019年间的5831条观测记录,研究者能够集中分析年龄、教育水平、居住地类型(城市或农村)以及财富状况对避孕方法选择(现代与传统的对比)的交互作用。该数据使学术界得以验证既有理论模型在非洲语境下的适用性,例如探讨女性教育程度提升与避孕普及率之间的因果路径。其意义在于,它将碎片化的国家调查数据(如DHS数据)统一整合为机器学习可用的表格格式,推动了从描述性统计向预测性与因果推断的范式跃迁,为全球健康不平等议题提供了详实的实证基础。
实际应用
在实际应用层面,该数据集对国际发展组织和非洲各国卫生部的项目规划具有直接指导价值。例如,非政府组织可利用该数据识别避孕普及率持续偏低的地区,并结合教育水平和财富阶层等分维度数据,设计针对性的健康教育宣传与免费避孕用具分发计划。联合国人口基金等机构能够根据年际变化趋势,评估既往干预措施的效果,优化资源配置。在公共卫生应急响应中,该数据可与冲突、灾害事件的地理信息交叉分析,揭示危机环境下生殖健康服务的中断程度。此外,机器学习工程师可基于此数据集构建轻量级预测API,部署在资源有限的非洲本地服务器上,为基层卫生工作者提供实时的区域避孕需求估算,从而推动数据驱动的精准健康服务落地。
数据集最近研究
最新研究方向
本数据集聚焦于非洲地区现代与传统避孕方法使用率的时空演变规律,为全球健康不平等议题提供了关键量化支撑。当前前沿研究正借助该数据集的细粒度分层维度(年龄组、教育水平、财富五分位及城乡类型),结合机器学习回归与分类模型,深入剖析社会经济地位与避孕普及率之间的非线性关联。尤其在联合国可持续发展目标(SDG 3.7)倡导下,该数据成为评估非洲各国生殖健康服务可及性进展、识别弱势群体断层、并指导精准干预策略的基石。其横跨1993至2019年的长时序记录,为追踪区域内公共卫生政策的历史效应与预测未来趋势赋予了不可替代的纵向洞察力。
以上内容由遇见数据集搜集并总结生成



