electricsheepafrica/africa-who-proportion-of-women-aged-15-49-years-who-make-their-own
收藏Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-proportion-of-women-aged-15-49-years-who-make-their-own
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)关于非洲国家15-49岁女性在性关系、避孕使用和生殖健康护理方面自主决策比例的统计数据。数据覆盖37个非洲国家,时间跨度为2006年至2021年,共68行数据。数据以Parquet格式存储,包含国家代码、年份、数值估计、置信区间等字段。数据集是Electric Sheep Africa项目的一部分,旨在为机器学习提供统一的非洲数据仓库。
This dataset contains country-level observations for the WHO GHO indicator "Proportion of women aged 15-49 years who make their own informed decisions regarding sexual relations, contraceptive use and reproductive health care (%)" (`SG_DMK_SRCR_FN_ZS`) across African nations, spanning 2006–2021. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集依托世界卫生组织全球卫生观察站(WHO GHO)的开放数据API,聚焦于非洲地区女性自主决策权的关键健康指标——即15至49岁女性在性关系、避孕及生殖健康护理方面做出知情决策的比例。数据以Parquet格式整理,采用统一的列式存储结构与标准化模式,所有数值均源自原始浮点精度字段,并附有置信区间上下界值,确保数据的一致性与统计严谨性。数据集涵盖37个非洲国家从2006年至2021年的观测记录,共计68行,严格限定于WHO非洲区域,并针对性别等维度进行了分层处理,使得每个国家、年份与维度的组合构成独立条目。
特点
该数据集的核心特色在于其高度结构化且即用性强的设计。它整合了WHO GHO的官方指标代码`SG_DMK_SRCR_FN_ZS`,提供了包括国家ISO代码、年份、数值估计、置信区间、显示字符串及多维度分类变量在内的丰富字段。维度变量如性别和居住区域类型的存在,使得研究者能够精准筛选或聚合不同子群的数据,从而支持精细化分析。数据集规模精巧(n<1K),但覆盖了非洲大陆的广泛地理与时间跨度,并采用CC BY 4.0许可协议,为机器学习和统计分析提供了可靠、可复用的基础。
使用方法
该数据集的使用极为便捷,可直接通过Hugging Face的`datasets`库加载。用户只需调用`load_dataset`函数即可将数据导入为DataFrame格式,进而进行探索性分析与建模。具体操作上,推荐通过过滤`dim1`字段来提取面向全国范围的“两性”数据,或按国家代码筛选特定国家的时间序列,例如利用`country_iso3 == 'KEN'`获取肯尼亚的逐年变化趋势。此外,结合`value_low`与`value_high`列,用户还能方便地构建误差带可视化,或将其纳入回归模型以考量不确定性。该数据集特别适合用于研究非洲女性赋权进程、生殖健康政策评估及跨国家比较分析。
背景与挑战
背景概述
该数据集源自世界卫生组织(WHO)全球卫生观察站(GHO)的健康指标,由Electric Sheep Africa项目团队整理并发布,时间覆盖2006至2021年,聚焦于非洲地区15-49岁女性在性关系、避孕措施及生殖健康护理方面自主决策的比例。核心研究问题在于量化女性在关键生殖健康领域的决策自主权,这一指标不仅是联合国可持续发展目标(SDGs)中性别平等与女性赋权的重要监测维度,亦为评估非洲地区卫生政策干预效果提供了关键数据支撑。通过标准化的数值指标与置信区间信息,该数据集为机器学习驱动的非洲健康与社会发展研究提供了高质量、可复用的基础资源,在公共健康领域的数据驱动决策与预测建模中具有显著影响力。
当前挑战
领域挑战方面,女性生殖健康决策自主权的精确测度面临定义复杂性、跨文化差异以及数据可比性等问题,该指标需综合社会、文化及制度因素,其统计建模容易受到缺失数据与样本量稀少的制约。构建过程中的挑战尤为突出:数据来源于WHO的OData API,涉及37个非洲国家仅68条观测记录,稀疏的时间序列与有限的地理覆盖使得时序趋势分析与空间推断极为困难;同时,数据包含按性别、居住地类型等多维度分层,维度组合引发的高稀疏性问题对机器学习模型的泛化能力构成严峻考验;此外,不同年份与国家的置信区间宽度差异显著,反映了数据质量的不均匀性,要求在模型设计中充分考虑异方差性与不确定性量化。
常用场景
经典使用场景
该数据集聚焦于非洲15至49岁女性在性关系、避孕措施及生殖健康护理方面自主决策的比例,是衡量女性赋权与生殖健康自主权的重要指标。在学术研究中,其经典用途是作为基线回归或分类任务的目标变量,用以分析国家层面女性自主决策的时空分布特征。研究者可借助该数据集构建预测模型,评估社会经济、教育水平或医疗资源可及性等因素对女性决策自主性的影响,亦可将其作为面板数据,追踪非洲各国在可持续发展目标(SDG)指标5.6.1上的进展。数据集结构简洁、覆盖时段明确,适合作为跨国比较分析的核心数据源。
衍生相关工作
该数据集的出现孕育了一系列衍生研究工作。其一,基于该数据的时间序列特征,研究者可构建非洲女性自主决策权的贝叶斯层级模型,用以预测缺失数据并估算未观测年份的国家表现。其二,可结合DHS(人口与健康调查)中关于教育、收入及生育率的微观数据,与这一宏观指标进行混合效应建模,探讨个体层面与国家层面因素对女性决策自主性的交互影响。其三,该数据集可与WHO中如孕产妇死亡率、避孕普及率等其他GHO指标进行面板协整分析,探索生殖健康领域内各类指标间的长期均衡关系,进而推动系统性健康决策支持工具的研发。
数据集最近研究
最新研究方向
在非洲女性自主决策权研究领域,该数据集的核心价值在于量化女性在性关系、避孕使用及生殖健康护理中自主决策的比例,为评估联合国可持续发展目标(SDG)中性别平等与女性赋权进展提供了关键基准。前沿研究聚焦于利用该跨年度面板数据(2006–2021年,覆盖37个非洲国家)构建多层级回归模型,以剖析社会经济地位、教育水平及卫生系统可及性如何动态交互影响女性生殖自主权。同时,研究者将其与WHO其他健康指标(如孕产妇死亡率、现代避孕普及率)联立分析,揭示女性决策权对公共卫生成果的因果传导路径。这一工作为政策制定者优化资源配置、设计文化敏感性干预措施提供了数据驱动的洞见,尤其是针对冲突频发或性别规范极严苛的地区,助力弥合非洲大陆内部显著的区域异质性鸿沟。
以上内容由遇见数据集搜集并总结生成



