five

electricsheepafrica/africa-who-adolescent-mortality-rate-mort10to19

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-adolescent-mortality-rate-mort10to19
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标“青少年死亡率(每1000名年龄特定群体)”在非洲国家的国家级观察数据,时间跨度为1990年至2021年。数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO Global Health Observatory的OData API获取,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自浮点精度字段(NumericValue),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low, value_high)。数据集覆盖47个非洲国家,总行数为13,536行,并可按性别等子维度进行筛选或聚合。

This dataset contains country-level observations for the WHO GHO indicator "Adolescent mortality rate (per 1 000 age specific cohort)" (`CHILDMORT10TO19`) across African nations, spanning 1990–2021. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available. The dataset covers 47 African nations with a total of 13,536 rows and can be filtered or aggregated by sub-dimensions such as sex.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集聚焦非洲地区青少年死亡率这一关键公共卫生指标,由世界卫生组织全球卫生观察站(WHO GHO)官方数据接口直接采集而来。原始数据经Electric Sheep Africa团队系统化整理与重构,以Parquet格式封装,并统一了列结构。所有数值均采用高精度的浮点型字段NumericValue,而非显示字符串,确保数据在机器学习任务中的适用性。当指标存在性别等分层维度时,每个国家与年份的每种组合均独立成行,同时附带了置信区间的上下限,极大提升了数据集的统计严谨性与可用性。
特点
该数据集覆盖了47个非洲国家自1990年至2021年间的青少年死亡率观测值,共计13,536条记录,时间跨度长达三十二年,具备良好的地域与时序广度。其核心特点在于结构化分层设计:通过dim1与dim2字段,研究者可灵活筛选按性别或居住区域类型细分的子维度数据。此外,数据集保留了原始数据中的置信区间信息,为后续不确定性量化与模型鲁棒性分析提供了坚实支撑。整体模式一致、便于机器读取,是面向非洲健康数据分析与建模的优质资源。
使用方法
调用HuggingFace Datasets库的load_dataset函数即可一键加载该数据集,返回的字典中'train'键对应全部样本,可直接转换为Pandas DataFrame进行探索。若需分析全国层面的总体趋势,可通过筛选dim1字段以'_BTSX'结尾或该字段为空的行,获得两性合计数据。针对国别时间序列分析,可依据country_iso3字段过滤特定国家,并结合year字段排序。这种灵活的过滤机制使得研究者能够便捷地从宏观趋势到具体国家进行多层级分析,适配分类与回归等多种机器学习任务场景。
背景与挑战
背景概述
在非洲大陆,青少年健康议题长期受到国际发展机构的密切关注,尤其是该地区居高不下的青少年死亡率构成了严峻的公共卫生挑战。该数据集由世界卫生组织(WHO)全球卫生观测站(GHO)创建,并由Electric Sheep Africa团队整理并托管于HuggingFace平台,旨在提供非洲各国1990至2021年间青少年死亡率(每1000名特定年龄组)的标准化观测数据。研究聚焦于量化非洲47个国家的青少年生存状况,为流行病学分析及政策干预提供数据基础。该数据集通过统一架构整合WHO官方API数据,覆盖年代跨度长、国家范围广,在推动非洲健康大数据可及性、支持机器学习建模以预测及解释死亡率趋势方面具有显著影响力。
当前挑战
该数据集面临的核心领域挑战在于青少年死亡率本身的多因素复杂性,其受传染病、暴力冲突、社会经济不平等及卫生服务可及性等多重变量交织影响,单纯依赖死亡率指标难以全面刻画健康干预的成效。在构建过程中,挑战主要来自数据异质性:不同国家和年份的记录完整性差异显著,部分观测值置信区间缺失;分层维度(如性别、城乡)的存在增加了数据稀疏性,在多任务回归或分类建模中需谨慎处理缺失值与多重比较。此外,整合OData API时需统一单位与字段格式,并确保仅使用NumericValue而非显示字符串,以避免因转录错误带来的定量偏差。
常用场景
经典使用场景
在非洲公共卫生与流行病学研究中,该数据集被广泛用于分析1990至2021年间47个非洲国家的青少年死亡率(每1000名特定年龄人口)的长期趋势。研究者通常将其作为回归任务的核心目标变量,通过国家、年份、性别等维度进行分层分析,例如评估不同性别间死亡率的差异,或追踪某个国家随时间推移的死亡率变化轨迹。其结构化表格数据格式与一致的Parquet存储,使得机器学习模型可快速加载并用于预测建模,为区域健康政策制定提供数据驱动的基础。
实际应用
在现实世界的公共卫生决策中,该数据集被国际组织、非政府组织及非洲国家卫生部用于青少年健康项目的评估与资源分配。通过分析死亡率高发国家或特定性别人群的时间序列,政策制定者能够识别健康干预的优先区域,例如针对青春期女孩制定专门的健康促进计划。此外,数据集提供的置信区间可帮助评估死亡率估计的不确定性,为设定联合国可持续发展目标(SDGs)中的青少年健康目标提供可量化的基准,并支持跨国合作项目的效果监测。
衍生相关工作
该数据集衍生出了一系列聚焦于非洲健康不平等与可预测性的经典工作。例如,研究者利用其维度(如性别、城乡)构建了多层次统计模型,揭示了特定国家青少年死亡率的性别差异模式及其随年份的变化。另一类代表性工作则基于该数据训练时序预测模型(如ARIMA或LSTM),以提前预警未来潜在的死亡率危机。还有研究将其与同一系列的其他非洲健康指标数据集(如孕产妇死亡率、传染病发病率)进行融合,构建了多变量因果推断框架,从而析出影响青少年生存的关键社会决定因素。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务