five

electricsheepafrica/africa-who-healthy-life-expectancy-at-age-60

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-healthy-life-expectancy-at-age-60
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了世界卫生组织全球健康观察站(WHO GHO)关于非洲国家60岁时健康预期寿命(HALE)的国家级观测数据,时间跨度为2000年至2021年。数据直接来自WHO GHO的OData API,并以Parquet文件的形式重新打包,具有一致的架构。所有数值均来自浮点精度字段(NumericValue),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low, value_high)。数据集是Electric Sheep Africa项目的一部分,该项目是一个统一的、适合机器学习使用的非洲数据存储库。

This dataset contains country-level observations for the WHO GHO indicator "Healthy life expectancy (HALE) at age 60 (years)" (`WHOSIS_000007`) across African nations, spanning 2000–2021. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲国家60岁健康预期寿命(HALE)这一关键指标。数据涵盖2000年至2021年间47个非洲国家,共计3102条观测记录。所有数值均采用浮点精度的原始数据字段,而非格式化显示字符串,并附带了置信区间上下限。数据以统一的Parquet格式重新打包,并整合了国家、年份、性别等维度信息,形成了一套结构清晰、便于机器学习直接使用的标准化数据集。
特点
该数据集的核心特色在于其多维分层结构,支持按性别(如男性、女性、总体)及居住地类型等子维度进行细致筛选与分析。每条记录均包含点估计值及其置信区间,为不确定性建模提供了可靠基础。数据覆盖了WHO非洲区域(AFRO)的全部47个国家,时间跨度长达22年,能够支撑纵贯性的健康趋势研究与区域比较分析,是探索非洲老龄人口健康不平等问题的宝贵资源。
使用方法
用户可通过HuggingFace Datasets库便捷加载该数据,例如使用`load_dataset("electricsheepafrica/africa-who-healthy-life-expectancy-at-age-60")`命令。加载后,数据可直接转换为Pandas DataFrame进行后续分析。建议按需筛选维度,例如通过过滤`dim1`字段中的`SEX_BTSX`值获取全国总体数据,或通过`country_iso3`字段锁定特定国家进行时间序列分析,实现灵活而精准的数据探索与建模任务。
背景与挑战
背景概述
健康预期寿命(Healthy Life Expectancy, HALE)是衡量老年人口健康水平的关键指标,尤其在老龄化趋势加剧的非洲地区,其数据对于评估公共卫生政策成效与分配医疗资源具有深远意义。世界卫生组织(WHO)依托全球健康观察站(GHO)长期追踪该数据,而由Electric Sheep Africa团队于2021年整理发布的非洲地区60岁健康预期寿命数据集,则以统一、机器学习友好的格式,将原本分散的官方指标结构化。该数据集涵盖了2000至2021年间47个非洲国家的3102条观测记录,涉及性别等子维度,为研究非洲老年人群健康不平等、区域差异及时间序列趋势提供了可靠基础,成为连接全球健康数据与本地化分析的重要桥梁。
当前挑战
该数据集所直面的是非洲公共卫生领域长期存在的核心挑战:如何基于有限且常不完整的官方数据,精准评估老年人群的实际健康水平。具体而言,首先,原始数据依赖各国报告质量,存在缺失值、统计口径不一致及时间间隔不均的问题,影响了跨国家跨年份的可比性。其次,健康预期寿命估算本身涉及复杂的生存质量调整,而非洲部分地区缺乏可靠的疾病负担数据,使得置信区间较宽。再者,数据构建过程中需严格处理性别与居住地分层信息,避免因过滤标准不同导致子集偏差。这些挑战共同要求数据使用者具备扎实的领域知识,在建模或推断时需纳入缺失机制与不确定性的量化处理。
常用场景
经典使用场景
在非洲公共卫生研究领域中,该数据集被广泛用于分析60岁人群的健康预期寿命(HALE)趋势,其经典使用场景包括构建时间序列模型以描绘2000至2021年间非洲各国健康长寿水平的变化轨迹,以及利用分类与回归算法探究性别、区域等分层维度对老年健康寿命的影响。研究者常通过过滤两性综合数据(SEX_BTSX)获得国家级整体估计,进而对比不同国家间的健康结局差异。
实际应用
在实际应用中,该数据集支撑着非洲各国卫生部门的政策制定与资源分配决策,例如用于识别预期寿命显著低于区域平均水平的国家,从而优先投放老年护理与慢性病防控项目。国际发展机构也借此进行健康援助的效果评估,通过比对干预前后HALE数值的变化来优化项目设计,同时保险公司可将其纳入精算模型,以更准确地估算非洲老年人群的健康风险与保险费率。
衍生相关工作
该数据集衍生了一系列代表性工作,包括基于多变量回归分析探究非洲国家HALE与医疗可及性、人均GDP等宏观指标的关联,并生成了区域健康图谱。研究者进一步将其与WHO其他指标(如死因别死亡率、非传染性疾病患病率)融合,构建了综合性老人健康脆弱性指数,或者利用置信区间信息开发了不确定性感知的预测模型,为有限数据环境下的稳健推断提供了方法论范例。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务