five

electricsheepafrica/africa-who-treatment-success-rate-for-patients-treated-for-mdr-tb

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-treatment-success-rate-for-patients-treated-for-mdr-tb
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标接受耐多药结核病(MDR-TB)治疗患者的治疗成功率(%)(TB_c_mdr_tsr)在非洲国家的国家级观察数据,时间跨度为2002年至2022年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO全球健康观察站的OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator Treatment success rate for patients treated for MDR-TB (%) (TB_c_mdr_tsr) across African nations, spanning 2002–2022. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲国家接受耐多药结核病(MDR-TB)治疗患者的成功率(%),涵盖2002至2022年间共570条观测记录。数据经过精心清洗与重构,以Parquet文件格式存储,并采用统一的列式架构,确保机器学习就绪。所有数值均取自高精度浮点字段(NumericValue),而非显示字符串,同时保留了置信区间上下界(value_low, value_high)以支持不确定性分析。数据集严格限定于WHO非洲区域(ParentLocationCode = 'AFR'),覆盖45个非洲国家,每个国家-年份组合为一个独立观测,未引入额外的子维度分层。
特点
本数据集的核心特点在于其高度标准化与机器学习兼容性。作为Electric Sheep Africa系列的一部分,它整合了WHO官方数据并加以重塑,每一行代表一个国家在特定年份的单一观测值,避免多维分层带来的复杂性。格式上,采用Parquet文件存储,支持快速I/O与内存效率。数据集中包含数值目标变量(value_numeric)、置信区间以及丰富的元数据列(如国家ISO代码、WHO区域、最后更新时间),为时间序列分析、回归建模或分类任务提供了坚实基础。此外,数据集附带了清晰的许可证(CC BY 4.0)与引用格式,确保合规使用。
使用方法
使用该数据集极为简便。用户可通过HuggingFace的datasets库直接加载,一行代码即可获取训练集:`load_dataset("electricsheepafrica/africa-who-treatment-success-rate-for-patients-treated-for-mdr-tb")`。加载后,可轻松转换为pandas DataFrame进行探索。对于需要全国层面且不分性别的分析,可通过过滤dim1列中值为空或以'_BTSX'结尾的行来实现。如需研究特定国家的时间趋势,则按country_iso3列筛选并依据year排序。数据集也支持直接以列名访问关键字段,如`value_numeric`作为回归目标,或`value_low`和`value_high`进行不确定性建模。
背景与挑战
背景概述
在全球公共卫生领域,耐多药结核病(MDR-TB)的治疗成功率是评估各国结核病防控成效的核心指标。该数据集由Electric Sheep Africa基于世界卫生组织全球卫生观察站(WHO GHO)的开放数据整理而成,记录了2002至2022年间45个非洲国家的耐多药结核病治疗成功率(TB_c_mdr_tsr)。数据集以统一架构的Parquet文件呈现,包含点估计值及置信区间,旨在为机器学习模型提供高质量、易于使用的非洲健康数据。其发布显著降低了研究者获取结构化、标准化非洲健康数据的门槛,为利用人工智能分析区域结核病治疗趋势、识别高风险群体及优化干预策略提供了关键支撑,对推动非洲大陆的精准公共卫生决策具有深远影响。
当前挑战
该数据集所解决的领域问题是非洲地区耐多药结核病治疗成功率数据的分散与不标准化,传统上这些数据散落于各国报告及WHO多维度表格中,难以直接用于跨国家、长时段的机器学习建模。构建过程中面临的挑战包括:从WHO GHO OData API抽取数据时需处理复杂的维度分层(如性别、城乡类型),确保仅提取未经分层(单值)的全国性指标以避免歧义;对原始字符串显示的置信区间进行解析并拆分为独立的数值字段,同时处理部分年份或国家数据缺失的情况;以及统一45个国家的编码体系、时间跨度与格式规范,最终形成570条高质量可训练记录。这些步骤共同确保了数据集的可靠性、可用性与跨领域可比性。
常用场景
经典使用场景
非洲世界卫生组织耐多药结核病治疗成功率数据集,汇集了2002至2022年间45个非洲国家关于耐多药结核病患者治疗成功率的年度观测数据。在公共卫生与流行病学研究中,该数据集被广泛用于评估非洲地区耐多药结核病治疗干预措施的有效性,分析治疗成功率随时间和地域的变化趋势,以及识别影响治疗效果的关键社会经济与医疗系统因素。研究者可借助该数据集构建时间序列模型,预测未来治疗成功率的变化方向,为制定区域性的结核病控制策略提供数据支撑。
衍生相关工作
基于该数据集,已衍生出多项具有影响力的研究工作,包括构建非洲耐多药结核病治疗成功率预测模型,探索其与抗结核药物耐药率、艾滋病毒感染率、人均医疗支出等指标之间的关联。此外,研究者也利用该数据评估了2015年后“终结结核病战略”在非洲的实施效果,并通过空间统计方法刻画了治疗成功率的区域聚集特征。该数据集还常与其他世界卫生组织全球卫生观察站指标联合使用,形成系统性的传染病治疗效果评估框架。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区耐多药结核病(MDR-TB)治疗成功率的时空动态分析,为全球卫生治理提供了关键数据支撑。结合世界卫生组织(WHO)将MDR-TB列为全球公共卫生紧急事件的背景,当前前沿研究多围绕治疗覆盖缺口、区域疗效差异及疗效与耐药性演变的关联展开。利用该涵盖45个非洲国家、横跨2002至2022年的高粒度面板数据,研究者可构建机器学习模型,精准捕捉社会经济、医疗基础设施等宏观因素对治疗成效的复杂非线性影响,尤其针对撒哈拉以南非洲疗效瓶颈的根源探析。此类研究对优化抗结核药物分配策略、指导WHO'终止结核病'目标在非洲的本地化实施具有深远意义,同时为后疫情时代全球健康韧性评估提供了实证基准。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务