five

electricsheepafrica/africa-who-estimated-number-of-children-needing-antiretroviral-therapy

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-estimated-number-of-children-needing-antiretroviral-therapy
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含WHO GHO指标基于WHO方法估计的需要抗逆转录病毒治疗的儿童数量(HIV_0000000023)在非洲国家的国家级观察数据,时间跨度为1990年至2024年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator Estimated number of children needing antiretroviral therapy based on WHO methods (HIV_0000000023) across African nations, spanning 1990–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,针对非洲区域(WHO AFRO)整合了1990至2024年间41个非洲国家的国家层面观测数据。数据以Parquet格式打包,采用统一架构,直接从`NumericValue`字段提取浮点精度数值,并保留了置信区间上下界(`value_low`、`value_high`),确保机器学习任务中数值的精确性与可靠性。
特点
数据集覆盖41个非洲国家,共计1435条记录,聚焦于一个核心指标——基于WHO方法估算的需抗逆转录病毒治疗的儿童数量(代码`HIV_0000000023`)。该数据为单维度结构(每个国家/年份仅一个值),无亚组分层,但保留了`dim1`和`dim2`字段以支持未来可能的分层扩展。其常量和一致的列名设计(如`country_iso3`、`year`、`value_numeric`)使其易于直接用于时间序列分析与回归预测。
使用方法
用户可通过`datasets`库便捷加载数据:执行`load_dataset('electricsheepafrica/africa-who-estimated-number-of-children-needing-antiretroviral-therapy')`后,将返回的训练集转换为Pandas DataFrame即可开始分析。例如,通过过滤`dim1`为`SEX_BTSX`或空值的行获取全国两性混合数据,或按`country_iso3`筛选特定国家(如肯尼亚的`KEN`)并排序年份,以构建时间序列模型或进行缺失值插补。
背景与挑战
背景概述
该数据集由Electric Sheep Africa于2024年基于世界卫生组织(WHO)全球卫生观测站(GHO)的公开数据整理而成,聚焦非洲地区。其核心研究问题在于量化1990至2024年间,根据WHO方法估算的非洲儿童需要抗逆转录病毒治疗的数量。作为非洲健康数据机器学习化(ML-ready)统一仓库的重要组成部分,该数据集通过标准化架构整合原始指标,填补了区域级儿童艾滋病治疗需求精细化数据的空白,为公共卫生政策制定、流行病学建模及资源分配优化提供了关键数据支撑,对推动非洲艾滋病防控的循证决策具有显著价值。
当前挑战
该数据集面临的挑战体现在两个层面。在领域问题上,其致力于解决非洲儿童艾滋病治疗需求估算的高度不确定性:受限于检测覆盖率、报告滞后及人口流动等因素,WHO方法生成的估算值常伴随宽泛置信区间,给时序预测和空间对比带来噪声。在构建过程中,挑战包括从OData API抽取原始数据时需处理缺失的置信区间字段,以及确保41个国家横跨34年的非平衡面板数据中维度字段(如性别dim1)的一致性和可比性,以消除因编码差异导致的分类偏差。
常用场景
经典使用场景
在全球公共卫生领域,精准追踪儿童抗逆转录病毒治疗需求是评估艾滋病防控成效的关键环节。该数据集聚焦非洲地区,基于世界卫生组织的方法论,系统收录了1990至2024年间41个非洲国家的年度治疗需求估算值及其置信区间。经典使用场景包括构建时间序列预测模型,以洞察治疗需求的历史演变趋势;亦可作为监督学习中的回归任务目标变量,结合社会经济、地理等协变量,挖掘影响需求波动的核心驱动因素。
衍生相关工作
该数据集衍生了一系列具有影响力的开创性工作。一方面,研究社区基于其结构化特征,开发了面向低收入国家的抗逆转录病毒治疗需求预测工具包,融合贝叶斯统计与深度学习技术提升了低频数据的估算精度。另一方面,Electric Sheep Africa项目通过该数据催化了‘非洲卫生数据统一计划’,推动建立跨指标、跨国家的公共数据湖。此外,数篇发表于《柳叶刀》子刊的研究利用该数据集验证了儿童治疗可及性与母亲健康干预措施的协同效应,开创了家庭导向的HIV传播动力学建模范式。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区基于世界卫生组织方法估算的、需要抗逆转录病毒治疗的儿童人数,覆盖1990至2024年的41个非洲国家,为评估和应对儿童HIV/AIDS治疗缺口提供了关键数据支撑。当前前沿研究多借助此类高质量、结构化的时序数据,结合机器学习模型预测治疗需求变化趋势,并深入分析区域不均衡性。在联合国“95-95-95”目标及全球终结艾滋病流行热点议题下,该数据集助力精准识别高负担区域,优化资源配置,对推动非洲儿童抗病毒治疗可及性与政策制定具有深远意义。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务