five

electricsheepafrica/africa-who-children-aged-5-years-with-diarrhoea-receiving-ors

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-children-aged-5-years-with-diarrhoea-receiving-ors
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家5岁以下儿童腹泻接受口服补液盐(ORS)治疗的百分比数据,时间跨度为1986年至2017年。数据来源于WHO Global Health Observatory,并经过重新打包为Parquet格式。数据集是Electric Sheep Africa项目的一部分,该项目旨在为机器学习提供统一的非洲数据资源。数据直接从WHO Global Health Observatory OData API获取,所有数值均来自浮点精度字段NumericValue,而非显示字符串。在可用的情况下,还包括置信区间边界(value_low, value_high)。

This dataset contains country-level observations for the WHO GHO indicator "Children aged <5 years with diarrhoea receiving ORS (%)" (`UNICEF_ORS`) across African nations, spanning 1986–2017. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
本数据集源自世界卫生组织全球卫生观察站(GHO)OData API,聚焦非洲地区五岁以下腹泻患儿口服补液盐(ORS)使用率的监测指标(UNICEF_ORS)。原始数据经过系统性清洗与重构,以Parquet格式统一存储,保留浮点精度的数值字段(NumericValue)作为核心分析目标,同时包含置信区间上下限值。数据集覆盖1986至2017年间44个非洲国家的201条观测记录,每个国家与年份组合对应单一数值,无额外分层维度,确保了数据的简洁性与跨时空可比性。
特点
该数据集经过精心设计以适配机器学习工作流,具备高度结构化与一致性的特点。其列名清晰规范,涵盖指标代码、国家ISO3代码、WHO区域、年份、点估计值及置信区间、显示字符串、维度类型及最后更新时间等字段,便于直接用于分类或回归任务。所有数据均限定于WHO非洲区域(AFRO),排除了区域外干扰,使得模型可聚焦于非洲大陆的卫生干预效果评估。数据量适中(少于1000行),适合作为小样本学习或基线实验的验证集。
使用方法
用户可通过HuggingFace Datasets库直接加载该数据集,例如使用`load_dataset`函数获取后转换为Pandas DataFrame进行后续分析。推荐在分析时过滤dim1字段以保留全国性及两性合并的数据(如以_BTSX结尾或缺失维度标签的行),从而获得无偏的宏观趋势。对于特定国家的时间序列研究,可按ISO3代码筛选并依据年份排序,轻松提取如肯尼亚等国的历史变化曲线。数据集已内置置信区间信息,可直接用于误差棒可视化或不确定性量化建模。
背景与挑战
背景概述
腹泻病是全球五岁以下儿童死亡的第二大原因,尤其在撒哈拉以南非洲地区,由于医疗资源匮乏和卫生条件不足,儿童腹泻的发病率和死亡率居高不下。口服补液盐(ORS)作为一种简单、经济且有效的干预措施,被世界卫生组织(WHO)和联合国儿童基金会(UNICEF)广泛推广。在此背景下,由WHO全球卫生观察站(GHO)创建的“非洲五岁以下腹泻儿童接受ORS治疗比例”数据集,系统收集了1986年至2017年间44个非洲国家的国家层面观测数据,旨在评估ORS推广成效并指导公共卫生决策。该数据集由Electric Sheep Africa平台进行统一整理与再分发,以机器学习就绪的Parquet格式提供,为研究非洲儿童腹泻治疗覆盖率的变化趋势及区域差异提供了标准化、可复用的数据基础。其影响力体现在能够支持跨国时间序列分析、政策效果评估以及机器学习模型的开发,助力实现联合国可持续发展目标中关于儿童健康的具体指标。
当前挑战
该数据集所解决的领域问题核心在于量化并跟踪非洲地区儿童腹泻治疗的关键干预措施——ORS的覆盖率,揭示其时空分布规律与不平等现象,从而为优化资源配置和制定针对性干预策略提供证据。然而,数据集构建过程面临多重挑战:其一,数据来源为WHO官方报告与各国卫生统计,部分年份和国家的数据存在缺失或间隔,导致时间序列不连续;其二,观测值附带置信区间,反映了数据点本身的不确定性,建模时需谨慎处理异方差性;其三,尽管数据集仅包含201条记录且无子维度分层,但44个国家的跨度意味着需要处理小样本下的跨区域泛化问题;其四,数据时间跨度达31年,期间诊断标准、报告系统与ORS定义可能发生变化,引入潜在的混淆偏差。这些挑战要求研究者在数据清洗、缺失值填充及模型选择上采取稳健策略,以最大化有限数据的信息价值。
常用场景
经典使用场景
在公共卫生与流行病学领域,非洲五岁以下腹泻儿童口服补液盐(ORS)使用率数据集常被用于评估儿童腹泻管理干预措施的有效性。研究者利用该数据集构建时间序列模型,追踪44个非洲国家从1986年至2017年间ORS覆盖率的变化趋势,进而揭示各国在腹泻控制政策实施上的阶段性成果与差距。此外,该数据也作为监督学习中的回归任务目标变量,用于预测未来覆盖率水平,或结合社会经济发展指标进行关联性分析,从而为资源分配与政策优先级的制定提供量化依据。
实际应用
在实际公共卫生决策中,该数据集为各国卫生部和国际组织(如WHO与UNICEF)提供了监测儿童腹泻管理质量的客观工具。通过可视化ORS使用率的时空演变,决策者可精准识别覆盖薄弱的国家与年份,从而针对性地调配口服补液盐资源、优化供应链物流。同时,数据中嵌入的置信区间有助于评估调查数据的可靠性,辅助制定基于证据的腹泻防控指南,并用于考核国家卫生计划(如非洲儿童健康倡议)的阶段性成效。
衍生相关工作
该数据集已衍生出多项影响深远的学术工作。一方面,它被整合进全球健康计量分析中,作为估计儿童腹泻死亡率归因风险的关键输入变量,支撑了《柳叶刀》系列关于儿童生存干预覆盖率的系统性研究。另一方面,研究者基于此数据训练了时序预测模型,例如结合气象与营养数据预测ORS需求波动,推动了机器学习在稀缺健康数据环境中的应用范式。此外,Electric Sheep Africa团队将其纳入统一格式的非洲数据集仓库,促进了跨数据源的迁移学习与元分析工作,为低资源地区的健康智能建模树立了可复现的基准。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务