five

electricsheepafrica/africa-who-life-expectancy-at-age-60

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-life-expectancy-at-age-60
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标“60岁时的预期寿命(年)”(WHOSIS_000015)在非洲国家的国家层面观测数据,时间跨度为2000年至2021年。数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO全球健康观察站OData API,并以Parquet文件格式重新打包,具有一致的架构。所有数值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集覆盖了47个非洲国家,总行数为3,102行,并包含子维度(如性别)的详细数据。

This dataset contains country-level observations for the WHO GHO indicator "Life expectancy at age 60 (years)" (WHOSIS_000015) across African nations, spanning 2000–2021. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available. The dataset covers 47 African nations with a total of 3,102 rows and includes detailed sub-dimensions such as sex.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
本数据集基于世界卫生组织全球卫生观察站(WHO GHO)的OData API构建,聚焦于非洲地区60岁人群预期寿命这一关键健康指标。数据收集涵盖2000年至2021年间47个非洲国家的年度观测值,总计3102条记录。原始数据经由规范化清洗流程处理,提取浮点精度的NumericValue字段作为核心数值,并附带置信区间上下界(value_low, value_high)以表征估计的不确定性。所有观测值按照统一模式重组为Parquet格式文件,确保跨国家、年份的兼容性与机器学习就绪性,同时保留了性别(SEX)等子维度分层信息,形成国家-年份-维度三元组结构的整洁数据集。
特点
该数据集的核心特点在于其严格遵循WHO AFRO区域定义,仅包含非洲国家数据,确保了地理聚焦的纯粹性。每条记录均包含指示符代码、国家ISO3编码、年份、数值估计及可选的置信区间,辅以维度和显示字符串字段,支持灵活的分层分析。特别地,性别维度(SEX_BTSX、SEX_FMLE、SEX_MLE)的引入允许研究者按性别分层探讨预期寿命差异,而缺失维度值则代表全国综合估计。数据规模适中(1K–10K量级),便于快速加载与迭代,非常适合作为回归或分类任务的训练基础。
使用方法
用户可通过HuggingFace Datasets库轻松加载此数据:执行`load_dataset('electricsheepafrica/africa-who-life-expectancy-at-age-60')`即可获取训练集,并转换为Pandas DataFrame进行下游分析。典型用法包括筛选全国综合数据(如过滤dim1以仅保留`SEX_BTSX`或空值),或按国家代码(如`KEN`)提取特定国家的时间序列。数据列结构清晰,`value_numeric`可直接作为回归目标,而`year`和`country_iso3`则适用于构建时空预测模型,同时置信区间字段可用于不确定性量化或贝叶斯分析。
背景与挑战
背景概述
在全球健康监测与老龄化研究领域,60岁时的预期寿命是衡量中老年人口健康状况与卫生系统绩效的关键指标。世界卫生组织(WHO)全球健康观察站(GHO)自2000年起系统收集并发布了该指标数据,而Electric Sheep Africa团队在此基础上,于2024年前后对非洲47个国家的相关数据进行了整合与再包装,形成了africa-who-life-expectancy-at-age-60数据集。该数据集以统一的Parquet格式提供,涵盖2000至2021年间的3102条观测记录,并包含性别等亚维度分层信息,旨在为机器学习驱动的非洲健康与老龄化研究提供标准化、可复用的数据基础。这一数据集不仅填补了非洲区域高粒度预期寿命数据的结构性空白,也为跨国家、跨时间序列的健康不平等建模与政策评估提供了重要支撑。
当前挑战
该数据集所解决的领域挑战在于,非洲地区长期面临预期寿命数据稀疏、指标定义不一、以及性别和城乡分层缺失等问题,限制了基于数据驱动的老龄化健康干预与预测研究的发展。在构建过程中,数据集面临多重挑战:首先,需要从WHO GHO的OData API中提取并清洗数据,确保NumericValue字段的浮点精度准确,同时处理置信区间上下限的缺失值。其次,由于部分指标存在按性别、居住地类型等维度进行分层,导致同一国家与年份可能产生多条记录,需设计清晰的过滤与聚合逻辑,以支持不同研究场景下的数据使用。此外,数据覆盖时间跨度长达22年,部分国家在某些年份可能存在数据不连续或延迟更新,需要通过一致的标识符与时间戳进行版本管理,确保数据集的时效性与完整性。
常用场景
经典使用场景
该数据集聚焦于非洲国家60岁时预期寿命的时空演变规律,为区域健康不平等研究提供了关键数据支撑。研究者常利用其按性别、年份和国别细分的结构化面板数据,构建回归模型或时间序列分析,以揭示非洲大陆内部预期寿命的分布特征与变迁趋势。数据覆盖47个非洲国家长达22年的观测,使其成为探讨非洲人口健康长期动态的经典基准,尤其适用于比较不同国家或性别群体间的健康结局差异。
衍生相关工作
围绕该数据集衍生出了一系列具有影响力的学术工作,主要集中在非洲人口健康的多维建模与预测领域。经典工作如利用面板回归分析预期寿命与医疗卫生支出、教育水平及环境暴露之间的关联,或应用贝叶斯层级模型生成精细年龄组寿命表的后验估计。此外,基于该数据集的机器学习研究探索了多种算法在缺失值插补与寿命趋势外推中的表现,推动了统计方法学在非洲健康数据场景下的适应性创新,并催生了多篇聚焦于非洲大陆内部健康不平等的比较性研究论文。
数据集最近研究
最新研究方向
非洲地区60岁预期寿命数据集(africa-who-life-expectancy-at-age-60)作为WHO全球卫生观察站的核心指标之一,近年被广泛运用于非洲人口健康动态的前沿追踪与建模分析。研究人员依托该数据集的时间序列与多维度分层特征(如性别、城乡分布),结合机器学习回归与分类算法,致力于揭示老龄化进程中健康不平等的地理异质性与社会经济驱动因素。尤其在新冠疫情后,该数据成为评估非洲卫生系统韧性、预测非传染性疾病长期负担以及检验可持续发展目标中健康相关指标进展的关键基准。其结构化整合至Electric Sheep Africa生态,更推动了跨区域健康数据标准化与可复现计算流行病学研究的落地。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务