five

electricsheepafrica/africa-who-number-of-deaths-among-adolescents

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-number-of-deaths-among-adolescents
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)关于非洲国家10至19岁青少年死亡人数(指标代码:DEATHADO)的国家级观察数据,时间跨度为1990年至2023年。数据来源于WHO Global Health Observatory的OData API,并以Parquet文件形式重新打包,具有一致的架构。所有数值均来自浮点精度字段(NumericValue),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集覆盖47个非洲国家,总行数为14,382行。数据还包含子维度,如性别(SEX_BTSX、SEX_FMLE、SEX_MLE),每个国家、年份和维度的唯一组合都会产生单独的行。

This dataset contains country-level observations for the WHO GHO indicator "Number of deaths among adolescents (10 to 19 years of age)" (`DEATHADO`) across African nations, spanning 1990–2023. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available. The dataset covers 47 African nations with a total of 14,382 rows. It also includes sub-dimensions such as SEX (SEX_BTSX, SEX_FMLE, SEX_MLE), where each unique combination of country × year × dimension produces a separate row.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
本数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区青少年(10至19岁)的死亡人数统计指标(代码DEATHADO)。数据经过系统性清洗与标准化处理,以Parquet文件格式重新封装,形成统一架构的机器学习就绪型语料库。所有观测值均采用浮点精度的NumericValue字段,而非显示字符串,同时纳入了置信区间上下限,确保数值的精确性与统计推断的完整性。数据集覆盖1990至2023年间47个非洲国家的14,382条记录,依据WHO AFRO区域代码进行筛选,并保留了性别等子维度信息,使得每一条记录均为国家、年份与分层的唯一组合。
使用方法
用户可通过HuggingFace的datasets库便捷加载该数据集,仅需调用load_dataset函数即可获得可直接转化为Pandas DataFrame的格式。典型使用场景包括:利用dim1字段过滤出两性合计(_BTSX)或国家级别的观测值,用于构建时间序列预测或回归模型;通过country_iso3和year字段对特定国家进行时序分析,研究死亡率变化趋势。鉴于数据已内置置信区间,研究者可直接用于不确定性量化或贝叶斯建模。推荐在建模前按需聚合亚组维度,或保留分层信息以挖掘性别等视角下的异质性规律。
背景与挑战
背景概述
该数据集由世界卫生组织(WHO)全球卫生观测站(GHO)于2023年创建,并经Electric Sheep Africa团队整理后发布至HuggingFace平台。其核心研究问题聚焦于非洲地区青少年(10至19岁)死亡人数的统计与分析,旨在为公共卫生政策制定、疾病负担评估及健康干预措施的效果监测提供可靠的数据支持。作为首个以机器学习友好格式统一整合的非洲健康数据资源,该数据集覆盖47个非洲国家、跨越1990至2023年的长期观测,并通过性别分层等维度细化了死亡率的异质性。其出现填补了非洲青少年死亡率高质量结构化数据的空白,对理解该区域非传染性疾病、意外伤害及传染病等主要死亡原因的动态演变具有重要推动作用,亦为国际健康不平等研究提供了关键数据基石。
当前挑战
该数据集所解决的领域挑战在于,非洲青少年死亡率长期缺乏标准化、跨国家跨时间可比的高频数据,传统数据源往往在格式、精度和覆盖范围上存在割裂,限制了基于机器学习的预测建模与趋势分析。在构建过程中,挑战主要体现在三个方面:首先,数据来源为WHO的OData API接口,原始数据包含大量缺失值、分层嵌套字段(如性别、居住区域)和多版本显示格式,需要转化为统一、简洁的Parquet格式,同时保留置信区间等统计信息;其次,47个国家的数据汇总要求处理不同的国家编码体系、时间分辨率差异以及历史数据修正,确保序列的连续性与一致性;最后,针对机器学习任务,需要合理处理分层维度(如SEX_BTSX、RURAL等),既保留细粒度信息,又避免因维度过多导致稀疏性与建模复杂度上升,从而在实证研究中实现准确的数据驱动决策。
常用场景
经典使用场景
在非洲青少年健康研究领域,该数据集成为评估10至19岁人群死亡负担的核心资源。经典使用场景包括通过时序分析揭示1990至2023年间不同非洲国家青少年死亡率的演变趋势,或利用性别(SEX)子维度探究男女青少年死亡风险的差异。研究者常将其与同期社会经济指标(如GDP、教育水平)联合建模,以识别高死亡率的国家集群,并构建回归模型预测未来变化。该数据集结构规范、覆盖47国,特别适合用于多国比较研究和区域健康差异量化分析,为理解非洲青少年生存状况的动态变迁提供了可靠的数据支撑。
解决学术问题
该数据集系统性地回应了非洲青少年死亡率研究中长期存在的跨国数据碎片化与可比性不足的学术困境。通过整合WHO全球卫生观测站官方数据并以统一格式发布,它使学者能够突破以往依赖单一国家或零散年份观测的局限。常见研究问题包括量化性别不平等在青少年死亡中的体现、识别高负担国家的地理聚集特征,以及评估千年发展目标等卫生政策干预对青少年生存的长期效果。该数据的置信区间字段进一步支持了不确定性量化研究,提升了非洲地区卫生统计推断的稳健性,为全球健康领域的循证决策奠定了方法论基础。
实际应用
在实际公共卫生场景中,该数据集助力国际组织与非洲各国卫生部开展循证资源配置。例如,非政府组织可依据特定国家与性别的死亡估算数据,优先将抗疟疾药物或孕产妇健康服务投放于青少年死亡率异常升高的地区。世界卫生组织非洲区域办事处能够利用该时间序列数据监测《2030年可持续发展议程》中关于降低青少年死亡率的进展,并进行趋势预警。此外,该数据集还支持健康经济分析,用于估算疾病负担的经济成本,并为制定针对性干预措施如校园健康筛查和性教育普及提供量化依据,切实推动非洲青少年健康水平的提高。
数据集最近研究
最新研究方向
该数据集聚焦于非洲青少年(10至19岁)死亡人数的时空分布与流行病学模式挖掘,为全球健康不平等议题提供了关键数据支撑。在公共卫生领域的前沿研究中,该指标常被用于评估可持续发展目标(SDGs)中健康相关目标的进展,尤其是针对青少年健康干预措施的成效量化。结合世界卫生组织(WHO)近年来倡导的“数据驱动决策”框架,该数据集通过高时间分辨率(1990-2023年)和性别、区域等多维分层结构,为机器学习建模(如时空预测、风险因子识别)提供了标准化训练样本。其价值在COVID-19大流行后愈发凸显——研究者可借此分析疫情对非洲青少年非传染病死亡率的影响,并指导资源精准配置,对推动非洲大陆实现全民健康覆盖具有战略意义。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务