five

electricsheepafrica/africa-who-cases-started-on-mdr-tb-treatment

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-cases-started-on-mdr-tb-treatment
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在2008年至2024年间开始接受多药耐药结核病(MDR-TB)治疗的病例数据,是世界卫生组织全球健康观察站(WHO GHO)指标Cases started on MDR-TB treatment(TB_c_mdr_tx)的国家级观测数据。数据直接从WHO GHO的OData API获取,并以Parquet文件格式重新打包,具有一致的架构。所有数值均来自浮点精度字段NumericValue,而非显示字符串。在可用的情况下,还包括置信区间边界(value_low, value_high)。该数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。

This dataset contains country-level observations for the WHO GHO indicator Cases started on MDR-TB treatment (TB_c_mdr_tx) across African nations, spanning 2008–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,经由Electric Sheep Africa项目重新打包为Parquet格式,以确保一致的Schema和机器学习友好性。数据记录了2008至2024年间47个非洲国家在耐多药结核病(MDR-TB)治疗启动病例上的年度观测值,共计751条记录。所有数值均采用浮点精度的`NumericValue`字段,而非显示字符串,同时附带了置信区间上下界(`value_low`、`value_high`)以增强数据完整性。数据集仅包含单一维度的国家-年份观测,无额外分层维度。
使用方法
用户可通过HuggingFace的`datasets`库便捷加载该数据集,例如使用`load_dataset('electricsheepafrica/africa-who-cases-started-on-mdr-tb-treatment')`获取训练集,并转换为Pandas DataFrame进行后续分析。对于分类或回归任务,建议过滤`dim1`字段以获取国家级、两性合计(`_BTSX`)的观测值,或按`country_iso3`列分组以构建单个国家的时间序列。数据集的标准化Schema使其易于与其它WHO GHO指标集成,适用于非洲卫生领域的建模与趋势分析。
背景与挑战
背景概述
耐多药结核病(MDR-TB)作为全球公共卫生领域的重大威胁,其治疗覆盖率的监测对遏制疫情扩散至关重要。世界卫生组织(WHO)全球卫生观察站(GHO)自2008年起系统收集非洲地区MDR-TB治疗启动病例数据,并由Electric Sheep Africa团队整合为机器学习就绪的数据集。该数据集涵盖47个非洲国家、2008至2024年的751条观测记录,聚焦于‘TB_c_mdr_tx’核心指标,为结核病流行病学建模、区域健康差异分析及政策效果评估提供了标准化、可复现的数据基础。其开放许可协议和统一架构显著降低了非洲健康数据的获取门槛,推动了数据驱动型公共卫生决策的发展。
当前挑战
该数据集所解决的领域核心挑战在于:非洲大陆长期面临MDR-TB治疗覆盖率数据碎片化、报告不一致及时间序列缺失的困境,传统统计方法难以精确刻画区域动态趋势。在构建过程中,面临的挑战包括:原始WHO API返回的数值字段可能包含显示字符串而非精确浮点值,需通过`NumericValue`字段进行严格清洗;置信区间数据(`value_low`、`value_high`)存在缺失,影响不确定性量化分析;不同国家对MDR-TB诊断标准与报告时滞的差异,导致跨国家可比性降低;此外,部分年份或国家的观测缺失(n<1K),需谨慎处理稀疏时间序列的插值与建模问题。
常用场景
经典使用场景
耐多药结核病(MDR-TB)作为全球公共卫生领域的重大挑战,其治疗覆盖率与患者管理效率始终是传染病防控的核心议题。该数据集汇集了2008至2024年间非洲47个国家启动MDR-TB治疗病例的官方统计信息,以国家-年份为基本观测单元,提供了病例估算值及其置信区间。经典使用场景包括构建时间序列预测模型以估计治疗启动人数的演变趋势,以及利用分类与回归模型探究地区间治疗覆盖率的差异。研究者可基于该统一格式的数据进行跨区域比较分析,评估各国应对MDR-TB的卫生系统响应能力。
解决学术问题
该数据集精准回应了资源匮乏地区传染病监测数据碎片化的学术痛点,为研究MDR-TB治疗可及性及其决定因素提供了标准化、可复现的数据基础。通过挖掘治疗启动人数在时间与空间上的分布模式,学者能够量化评估不同国家卫生政策干预的效果,识别影响治疗覆盖率的关键社会经济与环境变量。其重要意义在于推动了从个案描述向证据驱动分析的转变,例如借助回归与分类方法检验抗结核药物管理策略的有效性,从而为优化全球结核病控制规划提供统计支持。
实际应用
在实际应用层面,该数据集可直接服务于世界卫生组织非洲区域办事处及各国疾控部门,用于评估并优化MDR-TB治疗项目的资源配置与目标设定。公共卫生决策者能够通过分析治疗启动人数的年度波动,及时调整药物采购计划、培训医疗人员并加强患者随访体系。此外,非政府组织与援助机构可基于这些定量证据,精准定位治疗覆盖率偏低的区域并设计针对性干预措施,如开展社区筛查与移动诊疗服务。
数据集最近研究
最新研究方向
在全球公共卫生领域,耐多药结核病(MDR-TB)的治疗覆盖与监测已成为遏制结核病流行的关键挑战。该数据集聚焦非洲地区2008至2024年间启动MDR-TB治疗的患者数量,覆盖47个非洲国家,为量化分析非洲大陆在耐药结核病防控方面的进展提供了权威、标准化的时空数据基础。前沿研究方向包括:利用该数据集结合机器学习模型预测MDR-TB治疗覆盖率的区域差异与时间趋势,识别治疗缺口的高风险国家;探究与WHO其他健康指标(如HIV共感染率、卫生系统投入)的关联,以评估多因素协同作用对治疗启动率的影响;以及将数据集纳入全球健康公平性研究,量化非洲地区在实现WHO终结结核病战略目标中的差距。这一数据集为政策制定者与研究人员提供了关键工具,有助于推动以数据驱动的精准干预与资源分配,其意义在于填补了非洲地区MDR-TB治疗可及性系统性监测的数据鸿沟。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务