five

electricsheepafrica/africa-who-life-expectancy-at-birth

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-life-expectancy-at-birth
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察指标“出生时预期寿命(岁)”(WHOSIS_000001)在非洲国家的国家级观察数据,时间跨度为2000年至2021年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据仓库。数据直接来源于WHO全球健康观察OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator "Life expectancy at birth (years)" (`WHOSIS_000001`) across African nations, spanning 2000–2021. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区‘出生时预期寿命(年)’这一关键指标,覆盖2000年至2021年间47个非洲国家的3,102条观测记录。数据以Parquet格式标准化存储,所有数值均采用float精度的NumericValue字段,而非显示字符串,并附有置信区间边界值(value_low和value_high)。数据集按国家、年份及性别等维度进行分层组织,每个独特的国家—年份—维度组合生成独立行,便于多维分析。
特点
作为Electric Sheep Africa系列的一部分,该数据集以机器学习就绪(ML-ready)为核心理念,具备高度一致的结构化架构,包含indicator_code、country_iso3、year、value_numeric等13个字段,支持分类与回归任务。数据按WHO AFRO区域筛选,涵盖SEX_BTSX(两性)、SEX_FMLE(女性)和SEX_MLE(男性)三个子维度,用户可通过dim1/dim2字段灵活筛选特定分层。其时间跨度长达22年,为纵向健康趋势分析提供了坚实基础。
使用方法
通过HuggingFace的datasets库即可便捷加载,使用`load_dataset('electricsheepafrica/africa-who-life-expectancy-at-birth')`获取数据,并支持转换为pandas DataFrame进行后续处理。典型使用场景包括筛选两性国家层面数据(过滤dim1以_BTSX结尾或为空的行),或按国家代码提取单国时间序列(如针对KEN排序年份)。数据集遵循CC BY 4.0许可协议,适用于学术研究与公共卫生建模,引用时需注明WHO原始出处及Electric Sheep Africa的再包装贡献。
背景与挑战
背景概述
该数据集由世界卫生组织(WHO)全球卫生观察站(GHO)官方发布,经Electric Sheep Africa团队整理并托管于HuggingFace平台,旨在提供非洲国家2000至2021年间出生时预期寿命(WHOSIS_000001指标)的微观数据,覆盖47个非洲国家,总计3102条观测记录。作为非洲数据统一仓库的重要组成部分,该数据集填补了非洲大陆健康指标在机器学习可读格式下的空白,为区域健康不平等研究、公共卫生政策评估以及预测建模提供了关键基础,推动了发展中国家健康数据科学的发展。
当前挑战
数据集面临的挑战首先源自领域问题:非洲地区健康数据长期存在稀疏性、更新滞后及维度不统一等问题,使得基于模型的生命 expectancy 预测和跨区域比较极为困难。构建过程中,数据整合需从WHO OData API中抽取并清洗非结构化字段,处理不同性别、居住地区等亚维度的分层观测,同时保留置信区间信息;此外,如何保持47国数据在时间序列上的连续性,并剔除因卫生系统薄弱导致的异常值,同样是一项艰巨任务。
常用场景
经典使用场景
在公共卫生与人口健康研究的广袤领域中,由世界卫生组织全球卫生观测站提供的非洲出生时预期寿命数据集(WHOSIS_000001)扮演着基础性数据基石的角色。该数据集汇聚了2000至2021年间47个非洲国家的年度观测值,并提供了基于性别(男女合计、男性、女性)的亚组分层,因而成为探究非洲大陆人口健康变迁态势、比较不同国家间健康差异以及剖析长期健康趋势演进规律的经典时空数据资源。研究者可将其用于构建时间序列预测模型或回归分析框架,以揭示影响非洲各国预期寿命的关键社会经济与医疗体系因素。
实际应用
在实际应用层面,该数据集为国际卫生组织、非洲各国公共卫生部门以及非政府组织的决策制定与资源规划提供了量化洞察。借助其高质量的时序数据,政策制定者可以监测各国预期寿命的演变轨迹,识别健康绩效卓越或亟待干预的国家与群体,从而优化卫生预算的分配与重点项目的布局。此外,机器学习与数据科学领域的从业者可利用该数据集构建回归与分类模型,探索预期寿命与因变量(如经济指标、教育水平、环境因素)之间的映射关系,进而开发用于全球健康模拟与预警的智能系统,助力精准公共卫生策略的落地。
衍生相关工作
基于该数据集的核心指标,学界已衍生出一系列具有广泛影响力的经典研究工作。这些工作涵盖了利用面板数据固定效应模型探讨非洲国家人均医疗支出与预期寿命之间非线性关系的计量分析,以及结合地理空间数据与多层次模型揭示非洲内部健康不平等的地理分布格局研究。此外,也有学者依托该数据评估了特定全球健康倡议(如艾滋病抗逆转录病毒治疗推广计划)对非洲各国人群寿命的长期因果效应,并构建了基于过去二十年趋势的贝叶斯时空模型,用于精细预测未来年份的预期寿命变动。这些衍生工作不仅深化了对非洲健康转型驱动力的理论认知,也为循证健康政策的设计与评价确立了方法论典范。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务