electricsheepafrica/africa-who-estimated-antiretroviral-therapy-coverage-among-children
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-estimated-antiretroviral-therapy-coverage-among-children
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标儿童抗逆转录病毒治疗覆盖率估计(HIV_0000000024)在非洲国家的国家级观察数据,时间跨度为2000年至2024年。它是Electric Sheep Africa项目的一部分,该项目是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO Global Health Observatory OData API获取,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。
This dataset contains country-level observations for the WHO GHO indicator Estimated antiretroviral therapy coverage among children (HIV_0000000024) across African nations, spanning 2000–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区儿童抗逆转录病毒治疗覆盖率的估算指标(代码HIV_0000000024)。数据经由电气羊非洲项目(Electric Sheep Africa)进行统一清洗与标准化处理,以Parquet格式重新封装,确保其结构一致、便于机器学习应用。数值字段均采用高精度的浮点型数据(NumericValue),而非展示字符串,并尽可能保留置信区间上下界(value_low与value_high)。数据集覆盖2000至2024年间41个非洲国家的年度观察值,共计999条记录,仅包含WHO非洲区域办公室(AFRO)所辖国家,每一条记录对应特定国家与年份的唯一观测。
特点
此数据集最显著的特点在于其针对性与时效性。它专门针对儿童这一脆弱群体的抗逆转录病毒治疗覆盖率,数据跨度长达25年,能有效反映治疗策略的长期变化趋势。数据集中包含置信区间字段,为不确定性量化与统计推断提供了支持。此外,数据集以国家为基本单位,并设有维度字段(如性别、居住地区类型)以实现分层过滤,但本指标未包含亚维度,故每个国家与年份仅对应一个数值,简化了分析流程。其统一的Parquet格式与标准化的列名设计,亦使其与主流机器学习工作流高度兼容。
使用方法
使用者可通过Hugging Face的datasets库便捷加载该数据集,调用`load_dataset`函数即可获得可直接转换为Pandas DataFrame的训练集。建议在使用时关注维度过滤技巧,例如通过筛选`dim1`字段中以`_BTSX`结尾的行,或处理缺失值来聚焦于两性合计的全国层面数据。对于时间序列分析,可按国家代码(如`KEN`代表肯尼亚)筛选特定国家的记录,并以年份排序。数据集还明确标注了指标代码与数据更新时间,便于进行跨数据集引用或追踪数据源更新,适合用于回归预测、趋势分析等任务。
背景与挑战
背景概述
该数据集由世界卫生组织(WHO)全球卫生观察站(GHO)创建,并由Electric Sheep Africa团队整理发布,聚焦于非洲地区儿童抗逆转录病毒治疗(ART)覆盖率的估算。研究涵盖2000年至2024年间41个非洲国家的时空数据,旨在评估和追踪HIV/AIDS防治中关键干预措施的普及程度。作为全球卫生领域的重要指标,该数据集为公共卫生研究、政策制定及机器学习模型提供了统一、标准化的数据基础,对监测非洲儿童艾滋病治疗进展、评估地区差异及优化资源配置具有显著影响力。其开源的CC BY 4.0许可进一步促进了跨学科协作与研究复现。
当前挑战
该数据集所解决的领域问题在于,儿童ART覆盖率长期缺乏系统化、机器可读的时空预测数据,传统统计方法难以精准捕捉国家间及年份间的非线性趋势与异质性。构建过程中面临的挑战包括:整合来自WHO API的异构数据源时需处理缺失的置信区间值、不同维度(如性别、居住地类型)的稀疏分层,以及确保千级样本量下模型泛化能力。此外,数据的时间跨度虽长,但部分早期年份的覆盖缺失可能引入偏差,需谨慎处理以支持可靠的预测与政策分析。
常用场景
经典使用场景
该数据集聚焦于非洲地区儿童抗逆转录病毒治疗覆盖率的估计值,收录了2000至2024年间41个非洲国家的年度观测数据。在流行病学与全球健康研究领域,这一数据集常被用于构建时间序列模型,以揭示儿童艾滋病治疗覆盖率的动态演变趋势。研究人员可借助该数据集训练回归模型,预测未来年份的覆盖率水平,或通过分类任务识别影响覆盖率提升的关键国家与时期。其结构化的列设计,如置信区间上下限的提供,使得不确定性量化分析成为可能,从而为政策制定者提供更为稳健的数据支撑。
实际应用
在实际应用层面,该数据集为非洲各国卫生部门及国际组织(如WHO、UNAIDS、全球基金)提供了可操作的数据基础。决策者可基于历史覆盖率的预测趋势,动态调整儿童艾滋病诊疗服务的资源配置,确保抗病毒药物的供应链管理与实际需求相匹配。非政府组织可借助国家层面的覆盖缺口分析,优先介入治疗覆盖率长期低迷的地区开展针对性干预。此外,该数据同样适用于医疗健康领域的产业分析,帮助制药企业评估潜在药物需求,优化非洲市场的准入策略与定价模式。
衍生相关工作
围绕该数据集,研究者已衍生出多项具有学术影响力的经典工作。例如,基于该数据的时间序列性质,有学者开展了非洲儿童艾滋病治疗覆盖率与母婴传播率之间的关联分析,揭示了治疗覆盖提升对阻断病毒垂直传播的关键作用。与之相关的因果推断研究则尝试剥离其他混杂因素,量化抗病毒治疗普及对儿童生存率的净效应。此外,非洲区域间的聚类分析工作也常以此数据为核心变量,结合社会经济指标识别治疗覆盖率相似的亚群体,为区域协同干预策略的设计提供了实证依据。这些衍生活动极大地拓展了该数据集在公共卫生政策评估与健康公平性研究中的应用边界。
以上内容由遇见数据集搜集并总结生成



