five

electricsheepafrica/africa-who-mortality-rate-among-children-ages-10-to-14-years

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-mortality-rate-among-children-ages-10-to-14-years
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家世界卫生组织全球健康观察站(WHO GHO)指标“10至14岁儿童死亡率(每1000名10岁儿童)”(CHILDMORT_MORTALITY_10TO14)的国家级观察数据,时间跨度为1990年至2020年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator "Mortality rate among children ages 10 to 14 years (per 1000 children aged 10)" (`CHILDMORT_MORTALITY_10TO14`) across African nations, spanning 1990–2020. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观测站(WHO GHO)的OData API,聚焦非洲地区10至14岁儿童每千人的死亡率。Electric Sheep Africa团队对原始数据进行系统化重构,将指标代码为CHILDMORT_MORTALITY_10TO14的观测值转化为统一的Parquet格式文件。数据集涵盖了1990年至2020年间47个非洲国家的1457条记录,严格依据WHO AFRO区域代码进行筛选,并提取了NumericValue字段作为精准的浮点数指标值,同时保留了置信区间上下界等辅助信息。
使用方法
用户可通过HuggingFace Datasets库直接加载数据集,调用load_dataset函数即可获得可转化为Pandas DataFrame的训练集。筛选全国层面的全性别数据时,可过滤dim1字段以_BTSX结尾的条目;若要追踪特定国家的时间演变,例如肯尼亚的死亡率趋势,则对country_iso3字段进行条件过滤并按年份排序。该设计使得数据探索与建模流程高度简洁高效。
背景与挑战
背景概述
儿童青少年期的死亡率是衡量一个国家公共卫生系统效能与社会发展水平的关键指标之一,尤其在非洲大陆,该指标折射出深层次的医疗可及性、营养状况与疾病防控挑战。世界卫生组织(WHO)全球卫生观察站(GHO)发布的《10至14岁儿童死亡率(每1000名10岁儿童)》数据集,由Electric Sheep Africa团队于2020年前后整理并托管于HuggingFace平台,覆盖47个非洲国家自1990年至2020年的时序观测数据。该数据集以结构化、机器学习友好的Parquet格式呈现,纳入点估计值与置信区间,为研究非洲青少年生存状况、评估公共卫生干预效果、构建预测模型提供了稀缺且可靠的标准化数据基础,对全球健康不平等议题的量化分析具有重要推动作用。
当前挑战
该数据集所面对的领域问题核心在于非洲地区10至14岁儿童高死亡率背后的系统性健康挑战,包括传染病(如疟疾、艾滋病)、营养不良、以及医疗基础设施匮乏等多重因素的交织影响,亟需通过数据驱动的方法揭示其空间与时间分布规律。构建过程中面临的挑战则集中于数据来源的异构性与一致性:WHO GHO原始API返回的数据可能因国家报告能力差异而存在缺失值或置信区间不完整;跨年代际的统计口径与分层维度(如性别、城乡)的标准化处理要求极高的数据清洗精度;此外,47个国家的ISO编码与行政边界的一致性校验、以及长时间序列数据中可能存在的异常点识别,均为保证数据集可靠性的关键难点。
常用场景
经典使用场景
在非洲儿童健康研究领域,该数据集广泛用于构建10至14岁儿童死亡率的预测模型。研究人员常将其作为回归任务的基准数据集,通过国家层面的时间序列数据,分析社会经济、医疗资源与气候变化等多维因素对儿童生存状况的影响。分类场景中,基于阈值(如高死亡率国家识别)可辅助制定差异化干预策略。
解决学术问题
该数据集有效解决了非洲地区儿童中期死亡率长期缺乏标准化、结构化数据的困境,为量化分析区域健康不平等提供了可靠素材。学术界借助它探索死亡率随年份演变的趋势规律,揭示性别差异及城乡分层的深层原因,并支撑联合国可持续发展目标中关于儿童生存指标的监测与评估。
实际应用
在实际公共卫生决策中,该数据集被各国卫生部门与非政府组织用于绘制非洲儿童死亡风险热力图,识别亟需干预的高危地区。同时,它支持国际援助机构校准资源分配方案,优化疫苗接种、营养改善及疾病防控项目的优先级排序,显著提升有限医疗资源的利用效率。
数据集最近研究
最新研究方向
该数据集聚焦于非洲10至14岁儿童死亡率这一关键健康指标,为全球公共卫生领域提供了精细化、机器可读的时空数据支撑。当前研究前沿方向涵盖利用该数据集构建预测模型,探究社会经济、环境及医疗资源分配等因素对儿童存活率的动态影响;结合其他健康指标进行多变量分析,以揭示非洲地区儿童健康不平等的深层结构;以及运用时间序列方法评估区域内卫生政策干预的长期效果。鉴于非洲人口结构年轻化与可持续发展目标中降低儿童死亡率的紧迫性,该数据集的出现填补了该年龄段非洲大陆层面高分辨率数据的空白,其标准化的格式与WHO官方信源保障了研究的可复现性和跨国可比性,对推动循证决策与精准公共卫生干预具有深远意义。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务