five

electricsheepafrica/africa-who-adolescent-birth-rate

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-adolescent-birth-rate
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标“青少年生育率(每1000名女性)”(MDG_0000000003)在非洲国家的国家级观测数据,时间跨度为2000年至2023年。数据集是Electric Sheep Africa项目的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,所有数值均来自浮点精度字段(NumericValue),而非显示字符串。在可用的情况下,还包括置信区间边界值(value_low, value_high)。数据集覆盖47个非洲国家,共1279行数据,并且仅包含WHO AFRO地区(ParentLocationCode = AFR)的数据。

This dataset contains country-level observations for the WHO GHO indicator "Adolescent birth rate (per 1000 women)" (`MDG_0000000003`) across African nations, spanning 2000–2023. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available. The dataset covers 47 African nations with a total of 1,279 rows, filtered to the WHO AFRO region (`ParentLocationCode = AFR`).
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲大陆47个国家在2000年至2023年间青少年生育率(每千名女性)这一关键健康指标。数据经过系统性清洗与重构,全部采用浮点精度的数值字段(NumericValue)而非展示字符串,并保留了置信区间上下界(value_low、value_high)等统计信息。最终以Parquet格式整理为统一的机器学习友好型模式,隶属于Electric Sheep Africa系列数据集,确保跨国家、跨年份的数据一致性与可复现性。
特点
本数据集涵盖1279条观测记录,空间上覆盖WHO非洲区域(AFRO)的47个主权国家,时间跨度长达24年,为纵向与横向比较研究奠定了坚实基础。其独特之处在于保留了维度分层信息(如性别或居住地类型),每一行可表示国家、年份与特定分层的组合,支持灵活的数据筛选与聚合。同时,数据集提供了完整的元数据字段,包括指示符代码、国家ISO编码、WHO区域标识以及更新时间戳,极大便利了跨数据集的关联分析与溯源。
使用方法
用户可通过HuggingFace的datasets库直接加载数据集,例如使用`load_dataset("electricsheepafrica/africa-who-adolescent-birth-rate")`命令获取训练集,并将其转化为Pandas DataFrame以便进行深入操作。典型应用包括通过筛选`dim1`字段以获取全国性(以“_BTSX”结尾或缺失分层)的统计数据,或按国家ISO代码(如`country_iso3 == "KEN"`)提取特定国家的时间序列数据。该数据集适宜用于回归分析、时间序列预测或分类任务,如评估区域健康政策的干预效果或构建预测量化模型。
背景与挑战
背景概述
该数据集源自世界卫生组织全球卫生观察站(WHO GHO),由Electric Sheep Africa于2023年整理并发布,专注于非洲地区青少年生育率(每千名女性)这一关键公共卫生指标。作为联合国千年发展目标(MDG)监测体系的一部分,该指标直接关联青少年健康、性别平等与可持续发展议题。数据集覆盖2000年至2023年间47个非洲国家的1279条观测记录,采用统一Parquet格式并保留置信区间,为机器学习驱动的区域健康分析提供了结构化数据基础。通过整合官方权威数据与标准化预处理,该数据集在非洲健康研究社区中具有基准价值,尤其支撑跨国家、跨时序的青少年生殖健康建模与政策评估。
当前挑战
该数据集面临的挑战可分为领域与构建两个层面。在领域层面,青少年生育率受社会文化、教育水平、医疗可及性等多因素交织影响,模型需处理地理异质性与时间序列非平稳性,其中撒哈拉以南非洲地区的青少生育率普遍高于北部非洲,这种空间差异强化了迁移学习与多任务学习的必要性。在构建层面,原始WHO数据存在维度分层(如性别、城乡)导致的稀疏性问题,部分国家年份观测缺失,加之置信区间记录不完整,不仅影响插值策略选择,也对微调因果推断模型提出数据质量考验。
常用场景
经典使用场景
非洲青少年生育率数据集(Africa WHO Adolescent Birth Rate)汇聚了2000至2023年间47个非洲国家的官方统计指标,以每千名女性中的青少年生育数为核心观测值。在流行病学与社会人口学研究中,该数据集被广泛用于构建面板数据模型,评估国家层面青少年生育率的时空演变趋势,或结合教育、经济等协变量探究其驱动因素。研究人员可利用其结构化的国家-年份记录,进行聚类分析以识别高发区域,或通过回归建模预测政策干预的潜在效果,是衡量非洲大陆青少年生殖健康进展的关键量化工具。
衍生相关工作
基于该数据集,研究者已衍生出多项具有影响力的工作。例如,有学者将其与非洲教育入学率数据集联合分析,建立了解释青少年生育率下降的教育杠杆模型;亦有工作利用该数据训练机器学习代理模型,模拟不同避孕普及率情景下的生育率变化路径。此外,Electric Sheep Africa项目以该数据为核心,构建了统一的非洲健康指标仓库,推动了跨数据源匹配与特征工程的最佳实践,其预处理流程和抽样偏差修正方法被后续多项研究引用为基准。
数据集最近研究
最新研究方向
该数据集聚焦于非洲青少年生育率这一关键公共卫生指标,在可持续发展目标(SDGs)框架下,其研究前沿正从传统描述性统计转向机器学习驱动的预测建模与区域异质性分析。近年来的热点议题包括利用该数据评估新冠疫情对少女妊娠率的中长期冲击、量化冲突地区与气候危机叠加效应下的生育模式变迁,以及通过时间序列聚类识别东非与西非国家间日益扩大的差距。作为WHO全球卫生观察站官方数据的高质量整合版本,该数据集为验证干预政策有效性、训练青少年生殖健康预警系统提供了标准化垂直线性数据基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作