electricsheepafrica/africa-who-retreatment-cases-treatment-after-default
收藏Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-retreatment-cases-treatment-after-default
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家在1990年至2012年间关于复治病例:治疗后复发(肺部涂片和/或培养阳性)这一WHO GHO指标的观测数据。数据来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包。数据集涵盖了47个非洲国家,共552行数据,每行数据包含国家代码、年份、数值估计值、置信区间等信息。
This dataset contains country-level observations for the WHO GHO indicator Retreatment cases: treatment after default (pulmonary smear and/or culture positive) (`TB_ret_tad`) across African nations, spanning 1990–2012. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
本数据集依托世界卫生组织(WHO)全球卫生观察站(GHO)的OData API,系统性地获取了非洲地区“复治病例:违约后治疗(痰涂片和/或培养阳性)”指标(代码TB_ret_tad)的原始数据。原始数据经清洗与标准化处理后,以Parquet格式重新封装,形成具有统一架构的机器学习友好型数据集。所有数值均直接取自高精度浮点字段NumericValue,而非显示字符串,并保留了可用的置信区间上下界,确保了数据的准确性与完整性。
使用方法
用户可通过HuggingFace Datasets库轻松加载该数据集,例如使用`load_dataset("electricsheepafrica/africa-who-retreatment-cases-treatment-after-default")`命令。加载后,数据集以默认的`train`拆分形式呈现,可便捷地转换为Pandas DataFrame进行后续分析。若需聚焦于特定人群(如两性总计或全国水平),可通过筛选`dim1`字段(例如排除包含`BTSX`的行)实现。对于单个国家的时间序列分析,则可依据`country_iso3`字段过滤,并按`year`排序,以支持深度国家层面的纵向研究。
背景与挑战
背景概述
结核病作为全球公共卫生领域的重大挑战,尤其在非洲地区呈现出高负担与治疗管理复杂的双重困境。世界卫生组织全球卫生观察站(WHO GHO)于2012年发布的“结核病复治病例:治疗失败后再次治疗(痰涂片和/或培养阳性)”指标,聚焦于非洲47个国家1990年至2012年间因中断治疗而需重新干预的结核病例。该数据集由Electric Sheep Africa团队重新整理,整合了统一的机器学习就绪格式,旨在分析复治结核病例的时空分布与治疗依从性。作为非洲健康数据标准化的重要尝试,该数据集为结核病防控策略评估提供了跨国可比的时间序列依据,推动了循证卫生决策在资源有限地区的深化应用。
当前挑战
该数据集面临的核心挑战在于结核病复治病例的监测与统计复杂性。领域层面,非洲地区结核病治疗中断后的重新登记病例往往被低估,因患者失访、诊断能力不足及跨境流动导致数据完整性受损;同时,痰涂片与培养阳性的双重标准增加了病例定义的异质性,使得跨区域比较存在偏差。构建过程中,WHO原始OData API的异构数据转化为统一Parquet格式时,需处理缺失的置信区间字段、不同维度的分层过滤以及时间跨度内国家编码的变更,确保552条记录在低样本量(n<1K)下的统计稳健性。此外,缺乏亚维度划分使得性别、城乡等关键影响因素无法深入析取,限制了模型对治疗依从性差异的捕捉能力。
常用场景
经典使用场景
africa-who-retreatment-cases-treatment-after-default数据集专为非洲地区结核病复治病例中“治疗中断后重新治疗”的监测场景设计。该数据收录了47个非洲国家1990年至2012年间以肺部涂片和/或培养阳性为诊断依据的年度复治病例数量,提供数值点估计及置信区间。研究者和公共卫生部门可通过加载该Parquet格式的数据,按国家或年份筛选,分析治疗中断后重新治疗的病例趋势,评估不同地区结核病防控措施的成效与挑战。
解决学术问题
该数据集核心解决非洲结核病流行病学中复治病例的系统性量化难题,填补了区域级、长时间跨度标准化数据空白。学术上,它支持对结核病治疗中断模式的纵向分析,有助于揭示社会经济、医疗可及性等因素对复发风险的影响,推动预测模型构建与干预策略优化。通过提供置信区间,研究能更精确评估估计不确定性,对全球结核病控制目标的监测与区域健康政策制定具有深远意义。
实际应用
实际应用中,该数据集赋能非洲各国卫生部门及国际组织(如WHO)动态追踪结核病复治病例负担,指导资源配置和DOTS策略调整。通过趋势分析,可识别高复发率国家或年份,针对性强化患者随访与社区支持。同时,数据为医疗系统绩效评估提供基线,助力制定减少治疗中断的干预措施,如改进健康教育或缩短药物供应周期,直接改善患者预后与公共健康结局。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区结核病复发治疗中因中断治疗后复治的病例(痰涂片和/或培养阳性),在结核病防控领域具有前沿意义。近年来,全球结核病耐药性问题日益严峻,非洲作为高负担地区,该数据集通过提供1990至2012年间47个国家的标准化指标,为机器学习模型预测治疗结果与复发风险提供了关键基础。热点事件如世界卫生组织在2035年终止结核病战略的推进,使得这类精细化的纵向数据成为评估干预措施效果、优化资源分配的核心工具。数据集的可复现性与ML-ready特性,尤其有利于跨境对比分析,助力实现精准公共卫生决策,从而在抗击耐药结核与提升治疗依从性方面产生深远影响。
以上内容由遇见数据集搜集并总结生成



