five

electricsheepafrica/africa-who-estimated-number-of-pregnant-women-living-with-hiv-needing

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-estimated-number-of-pregnant-women-living-with-hiv-needing
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含WHO GHO指标估计需要抗逆转录病毒药物以预防母婴传播的HIV感染孕妇数量(`HIV_0000000021`)在非洲国家的国家级观测数据,时间跨度为1990年至2024年。它是[Electric Sheep Africa](https://huggingface.co/electricsheepafrica)集合的一部分,这是一个统一的、适合机器学习使用的非洲数据仓库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自`NumericValue`(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(`value_low`,`value_high`)。

This dataset contains country-level observations for the WHO GHO indicator "Estimated number of pregnant women living with HIV needing antiretrovirals for preventing mother-to-child transmission" (`HIV_0000000021`) across African nations, spanning 1990–2024. It is part of the [Electric Sheep Africa](https://huggingface.co/electricsheepafrica) collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
在非洲公共卫生领域,准确估计需要抗逆转录病毒药物以预防母婴传播的HIV感染孕妇数量,对于制定有效的干预策略至关重要。本数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,由Electric Sheep Africa团队整理并重新打包为Parquet格式,确保数据结构一致且可直接用于机器学习。数据涵盖1990至2024年间41个非洲国家的年度观测值,共包含1,396条记录。所有数值均来源于原始API中的浮点精度字段`NumericValue`,并尽可能包含置信区间上下限(`value_low`、`value_high`),以提供更丰富的统计信息。数据集的构建遵循标准化模式,每一行对应一个国家、年份与潜在分层维度的唯一组合,便于后续分析与建模。
使用方法
研究人员可通过Hugging Face的`datasets`库便捷加载该数据集,只需一行代码即可将数据转换为Pandas DataFrame进行后续分析。典型使用方式包括:利用`load_dataset`函数直接获取训练集,随后通过筛选`dim1`字段中以`_BTSX`结尾的值或缺失值,提取两性合并的全国层面数据。对于国别时间序列分析,可按`country_iso3`字段过滤特定国家(如肯尼亚)并按年份排序。数据集的列结构明确,`value_numeric`可作为回归任务的目标变量,而`year`与`country_iso3`则是核心特征。由于数据为Parquet格式,支持高效的列式读取与大型数据集处理,适合在计算资源有限的环境下进行探索性数据分析或构建预测模型。
背景与挑战
背景概述
在全球公共卫生领域,消除艾滋病病毒(HIV)母婴传播是联合国艾滋病规划署及世界卫生组织(WHO)的核心战略目标之一。该数据集由世界卫生组织全球卫生观测站于2024年发布,经Electric Sheep Africa团队重新整理后提供,聚焦于非洲地区感染HIV且需要抗逆转录病毒药物以预防母婴传播的孕妇估计人数。数据涵盖1990年至2024年间41个非洲国家,共计1,396条观测记录,为研究非洲大陆HIV母婴传播干预效果、评估抗逆转录病毒治疗覆盖率及优化资源配置提供了关键的量化基础。作为非洲区域卫生数据统一机器学习平台的重要组成部分,该数据集填补了该领域高质量、结构化、易用数据集的空白,有力推动了基于证据的公共卫生决策与相关算法模型的开发。
当前挑战
该数据集主要解决的领域问题在于,尽管全球在预防HIV母婴传播方面取得显著进展,但非洲地区因医疗基础设施不均、数据报告体系薄弱,导致对孕妇中HIV感染人数及治疗需求量的精确估算存在巨大困难。构建过程中面临的挑战包括:不同国家间病例报告标准不一、数据采集时间点与统计方法存在差异,导致跨国家、跨年度的可比性较低;WHO原始数据中部分观测值缺少置信区间,影响了统计分析的不确定性量化;此外,数据集包含的1,396条记录虽覆盖时间跨度长但样本量有限,对区域子群体及时间序列的精细化建模造成约束,需借助外部数据源进行交叉验证与缺失值插补。
常用场景
经典使用场景
在非洲公共卫生与流行病学研究中,该数据集被广泛用于分析和预测妊娠期HIV阳性女性对预防母婴传播抗逆转录病毒药物的需求趋势。研究者通常利用其跨年份(1990–2024)和跨国家(41个非洲国家)的结构化面板数据,构建时间序列模型或回归分析,以揭示不同国家药物需求量的演变规律及区域差异。该数据集凭借其清晰的指标编码与置信区间字段,成为评估母婴HIV传播干预政策效果、优化资源配置的经典基准数据源。
解决学术问题
该数据集有效解决了非洲地区妊娠期HIV阳性女性抗逆转录病毒药物需求量化评估的学术难题。传统研究常因数据碎片化或口径不一而难以进行跨国比较与长期趋势分析,而该数据集通过统一规范的WHO GHO指标,提供了可靠的点估计与置信区间,使学者能够定量分析药物需求的时空分布特征。其核心意义在于为评估“消除母婴传播”全球目标的实现进展提供了可复现的数据基础,推动了健康公平性、卫生政策效果评估等领域的实证研究。
实际应用
在实际卫生政策制定与项目管理中,该数据集的直接价值在于辅助国际组织、非洲各国卫生部门及非政府机构进行抗逆转录病毒药物的采购规划与供应链管理。公共卫生官员可依据各年份各国家的估计数据,预判未来药物需求量,合理分配预算与物流资源,确保预防母婴传播项目的持续性。此外,该数据还常用于医保覆盖策略的优化、健康影响评估报告的撰写以及区域性疫情动态监测,成为联结数据科学与一线卫生决策的关键桥梁。
数据集最近研究
最新研究方向
在艾滋病母婴传播防控领域,该数据集为评估非洲地区抗逆转录病毒药物需求提供了关键量化支撑。随着全球消除艾滋病母婴传播目标的推进,研究重心正转向对孕妇感染人数的时空动态建模与资源分配优化。借助该数据集覆盖1990至2024年间41个非洲国家的观测记录,学者得以结合置信区间开展贝叶斯层级回归或生存分析,精准识别防控薄弱环节与趋势拐点。其结构化设计便于与地理、社会经济变量融合,驱动基于机器学习的需求预测与政策模拟,为世界卫生组织及区域卫生规划提供循证依据,助力加速实现艾滋病母婴传播的终结。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务