five

electricsheepafrica/africa-who-children-aged-6-59-months-who-received-vitamin-a

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-children-aged-6-59-months-who-received-vitamin-a
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(GHO)指标“6-59个月大儿童接受维生素A补充的比例”(`vita`)在非洲国家的国家级观察数据,时间跨度为2000年至2019年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习应用的非洲数据存储库。数据直接来自WHO GHO OData API,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自`NumericValue`(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(`value_low`,`value_high`)。

This dataset contains country-level observations for the WHO GHO indicator "Children aged 6-59 months who received vitamin A supplementation (%)" (`vita`) across African nations, spanning 2000–2019. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集以世界卫生组织全球卫生观察站(WHO GHO)的公开数据为基础,聚焦于非洲地区6至59个月儿童维生素A补充覆盖率的指标(代码vita)。原始数据通过OData API采集,经标准化处理后以Parquet格式存储,保留浮点精度的数值字段(NumericValue),同时附带了置信区间上下限(value_low、value_high)。数据覆盖2000至2019年间40个非洲国家,共计4483条观测记录,并依据WHO AFRO区域代码进行筛选。每条记录按国家、年份、维度(如性别、年龄组、居住地类型等)进行分层,形成独特的组合行。
特点
数据集的最大特色在于其精细化的多维度分层结构。包含年龄组、教育水平、居住地类型、性别、财富十分位数和五分位数等多个子维度,使用者可根据dim1和dim2字段选择特定层级,或跨层级聚合分析。所有数值均源自WHO官方统计,数据类型以分类和回归任务为主,适合机器学习建模。此外,表格结构统一、列名规范,并附带了置信区间信息,便于进行统计推断和不确定性评估。
使用方法
通过HuggingFace的datasets库可一键加载该数据集,例如使用load_dataset函数加载后转换为Pandas DataFrame进行后续处理。若需获取全国层面、两性合并的数据,可通过过滤条件筛选dim1字段以_BTSX结尾或缺失值的行。对于特定国家的时间序列分析,可依据country_iso3列(如KEN代表肯尼亚)进行切片,并按年份排序。加载后的数据可直接用于回归或分类任务的模型训练与评估。
背景与挑战
背景概述
该数据集由世界卫生组织(WHO)全球卫生观察站(GHO)于2019年创建,并经Electric Sheep Africa团队整理发布,聚焦于2000至2019年间40个非洲国家中6至59个月儿童补充维生素A的覆盖率。维生素A缺乏是全球公共卫生领域长期关注的议题,尤其在撒哈拉以南非洲地区,其引发的夜盲症和免疫系统削弱对儿童健康构成严重威胁。该数据集以标准化表格形式收录了超过4400条国家层面的年度观测记录,涵盖了性别、居住区域、教育水平和财富分位等多维分层信息,为评估非洲区域维生素A补充计划的实施效果和时空分布差异提供了关键量化基础。其开源许可(CC BY 4.0)和机器学习友好格式显著降低了研究门槛,推动了数据驱动型卫生政策分析的发展。
当前挑战
该数据集所应对的核心领域挑战在于非洲地区维生素A补充计划覆盖面不均且监测数据碎片化,传统研究难以整合多国长期趋势与亚群体差异。数据集构建过程中面临显著挑战:首先,WHO原始数据需从OData API逐一抓取,跨21年的历史数据清洗需处理部分年份或国家的缺失值,且置信区间(value_low/value_high)仅在部分记录中可用;其次,40个国家的异构报告体系导致指标定义和测量方法存在细微差异,需通过统一模式映射为规范的数字化字段;再者,分层维度(如按财富分位和地理区域划分)组合产生的数千条记录需避免重复和逻辑冲突,确保每对国家-年份-维度组合的唯一性,对数据管道的鲁棒性提出了严苛要求。
常用场景
经典使用场景
该数据集聚焦于非洲6至59个月儿童补充维生素A的覆盖率情况,是公共卫生和流行病学研究中经典的分类与回归任务用例。研究者常借助这一结构化表格数据开展时间序列分析,评估各国在2000至2019年间补充计划的执行成效,亦可依照性别、居住地类型、教育水平或财富分位等子维度进行亚组比较,以揭示干预覆盖中的不平等现象。
衍生相关工作
基于该数据集,衍生出了多项涉及机器学习预测模型与可视化分析工具的经典工作。研究者构建了针对非洲儿童营养干预覆盖率的回归预测框架,融合了社会经济与地理特征以推估缺失数据;亦有人开发了交互式时空仪表盘,动态展示各国覆盖率变迁轨迹,为后续构建覆盖预警系统与政策模拟平台奠定了方法论基础。
数据集最近研究
最新研究方向
该数据集聚焦于非洲6至59个月儿童维生素A补充覆盖率的时空动态与不平等性分析,是评估全球营养干预成效的关键窗口。当前前沿方向包括利用该数据训练机器学习模型,以预测补充率波动并识别干预薄弱区域,同时结合经济、教育、居住地等维度分层,剖析社会决定因素对健康可及性的深层影响。在SDGs与非洲公共卫生议程加速推进的背景下,该数据集为量化区域差异、优化资源分配及验证跨国产出提供了可靠依据,其整合的置信区间与多维度属性更支撑起对营养政策效果的稳健推断,成为连接宏观监测与微观决策的枢纽。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务