five

electricsheepafrica/africa-who-low-birth-weight-prevalence

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-low-birth-weight-prevalence
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家2000-2020年间WHO GHO指标低出生体重发生率(%)(LBW_PREVALENCE)的国家级观测数据,是Electric Sheep Africa收集的一部分 - 一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO全球健康观察站OData API获取,并以Parquet文件格式重新打包,具有一致的架构。所有值都来自NumericValue(浮点精度字段),而不是显示字符串。在可用的情况下,包含置信区间边界(value_low, value_high)。

This dataset contains country-level observations for the WHO GHO indicator "Low birth weight prevalence (%)" (`LBW_PREVALENCE`) across African nations, spanning 2000–2020. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的开放数据接口,聚焦于非洲大陆各国低出生体重发生率(LBW_PREVALENCE)这一关键健康指标。数据覆盖2000年至2020年间36个非洲国家的年度观测值,共计756条记录。原始数据经由WHO AFRO区域筛选后,以Parquet格式重新打包,并采用统一的数据模式进行整合。所有数值均取自高精度的浮点型字段NumericValue,同时保留了置信区间上下限(value_low, value_high)以供后续分析参考。该数据集隶属于Electric Sheep Africa项目,旨在为机器学习应用提供结构化的非洲健康数据资源。
使用方法
用户可通过HuggingFace的datasets库便捷地加载该数据集,例如使用`load_dataset`命令,并将其转换为Pandas DataFrame进行分析。为聚焦于全国总体水平,建议通过筛选dim1字段中后缀为`_BTSX`或缺失值的行来获取两性合并的数据子集。针对特定国家的时间序列分析,则可依据`country_iso3`字段进行过滤,并配合`year`字段排序。该数据集既适用于分类任务,也适用于回归建模,用户可根据研究目的从`value_numeric`字段中提取标签或目标变量进行机器学习模型训练与评估。
背景与挑战
背景概述
低出生体重(LBW)是全球公共卫生领域长期关注的重大议题,与新生儿死亡率、儿童发育迟缓及成年期慢性疾病风险密切相关。世界卫生组织(WHO)通过全球卫生观察站(GHO)系统持续监测这一指标,然而非洲地区的数据因国家间统计能力差异、报告标准不一而长期碎片化,阻碍了区域健康政策的制定与机器学习模型的跨国家泛化。为弥补这一空白,Electric Sheep Africa 团队于2023年前后从WHO GHO的OData API系统性地整理并发布了该数据集,涵盖2000年至2020年间36个非洲国家的低出生体重患病率数据,总计756条观测记录。该数据集以统一的schema、Parquet格式封装,并保留了置信区间等统计细节,为非洲健康领域的因果推断、时空预测及政策评估提供了高质量、可复现的机器学习基础资源。
当前挑战
该数据集所应对的领域挑战在于:非洲低出生体重患病率的时空异质性显著,传统统计模型难以捕捉国家间稀疏且不均衡的观测模式,从而制约了区域级疾病负担的动态归因与预警系统的构建。数据集本身则面临构建过程中的若干棘手难题:首先,GHO原始数据存在大量缺失值和报告延迟,部分国家在特定年份无有效记录,需设计鲁棒的填补策略以避免引入偏差;其次,不同国家的数据采集方法(如基于活产登记或调查估计)导致指标定义的细微差异,在整合时需审慎处理异质性;最后,数据集规模较小(756条),且仅有单指标无子维度,限制了深度学习模型的训练能力,亟需通过多源数据融合或时间序列增强技术来克服统计效力不足的瓶颈。
常用场景
经典使用场景
该数据集记录了非洲36个国家在2000年至2020年间低出生体重流行率的年度观测数据,为时间序列预测和跨国家面板分析提供了理想的数据基础。研究人员可将其用于低出生体重流行率的趋势建模、区域差异性分析,以及与经济发展、医疗基础设施等外部变量关联的回归研究。数据集结构统一且经机器学习友好化处理,适用于表格分类与回归任务,并能直接接入主流深度学习框架进行模型训练与评估。
解决学术问题
在公共卫生与流行病学领域,该数据集填补了非洲地区低出生体重长期追踪数据的标准化缺口,解决了因数据零散、格式不一导致的研究障碍。学者借此能够系统评估非洲大陆低出生体重的时空演变规律,量化各国在千年发展目标框架下的健康进展,并探究社会经济、环境暴露等风险因素对新生儿健康的影响。数据集附带的置信区间信息更支持统计推断与不确定性分析,提升了研究结论的可靠性。
实际应用
在实际应用中,该数据集能够支撑世界卫生组织及各国卫生部门制定针对性的母婴健康干预策略。通过监测低出生体重流行率的年度变化,政府可识别高风险区域与脆弱人群,优先分配医疗资源并设计孕期营养补充、疾病防控等精准干预项目。同时,该数据可作为评估公共卫生政策成效的客观指标,助力全球减少低出生体重发生率的可持续发展目标监测。
数据集最近研究
最新研究方向
在全球公共卫生监测体系中,低出生体重发生率作为衡量母婴健康与营养状况的核心指标,始终备受关注。该数据集聚焦非洲36国2000至2020年的时空分布,为探索区域间低出生体重差异的驱动因子、评估卫生干预政策成效提供了标准化、可复现的机器学习就绪数据。结合世界卫生组织全球卫生观察站的最新动态,研究者可借助该数据集深入剖析社会经济、环境暴露及医疗可及性等因素对妊娠结局的交互影响,尤其在非洲脆弱群体中,其对实现可持续发展目标中降低低出生体重比例的里程碑意义愈发凸显。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作