five

electricsheepafrica/africa-who-smear-positive-tuberculosis-treatment-success-rate

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-smear-positive-tuberculosis-treatment-success-rate
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在1994年至2011年间,关于涂片阳性肺结核治疗成功率(%)的观测数据。数据来源于WHO Global Health Observatory,并以Parquet文件格式重新打包,包含数值估计、置信区间等信息。数据集覆盖47个非洲国家,共计706行数据。

This dataset contains country-level observations for the WHO GHO indicator Smear-positive tuberculosis treatment-success rate (%) across African nations, spanning 1994–2011. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织(WHO)全球卫生观察站(GHO)的开放数据API,聚焦于非洲地区涂阳肺结核治疗成功率(MDG_0000000031)这一关键健康指标。Electric Sheep Africa项目团队对原始OData接口返回的数据进行了系统化清洗与重封装,从中提取出浮点精度的核心数值字段(NumericValue),而非直观的显示字符串。所有观测值按国家、年份和维度进行结构化存储,并保留了可用的置信区间上下界信息,最终以统一的Parquet文件格式呈现,形成了一套即插即用的机器学习就绪数据集。
使用方法
用户可通过HuggingFace的datasets库直接加载该数据集,如`load_dataset('electricsheepafrica/africa-who-smear-positive-tuberculosis-treatment-success-rate')`,返回的Dataset对象可便捷地转换为Pandas DataFrame进行后续处理。典型的使用案例包括按国家筛选特定时间序列,例如提取肯尼亚(KEN)的历年数据并按年份排序;或通过过滤dim1字段以获取仅涵盖两性(BTSX)的全国层面统计,从而规避性别或地域亚组带来的混杂效应,聚焦于国家级的总体疗效评估。
背景与挑战
背景概述
结核病作为全球公共卫生领域的重大挑战之一,其治疗成功率是衡量防控成效的核心指标。世界卫生组织(WHO)全球卫生观察站(GHO)自1994年起持续追踪各国涂阳肺结核治疗成功率,并于2011年发布了覆盖47个非洲国家的系统性数据集。该数据集由Electric Sheep Africa团队统一重构,以机器学习友好型格式呈现,旨在填补非洲地区高质量公共卫生时序数据的空白。作为千年发展目标(MDG)监测体系中的关键指标(代码MDG_0000000031),该数据集为评估撒哈拉以南非洲地区结核病控制策略的有效性提供了量化依据,对推动全球健康平等与数据驱动决策具有重要学术价值。
当前挑战
该数据集所解决的领域挑战在于:涂阳肺结核作为最具传染性的结核病类型,其治疗成功率在非洲长期受限于医疗资源匮乏、诊断滞后及治疗依从性低等问题,缺乏标准化、跨国家的纵向数据用于流行病学建模与政策评估。构建过程中仍面临多重挑战:数据覆盖年份限于1994–2011年,时效性不足;部分国家亚组(如按性别或城乡分层的治疗率)存在大量缺失值;置信区间字段(value_low/value_high)记录不完整,限制了不确定性分析;且原始API的数据采集需处理多源异构格式,对齐不同国家报告标准时可能引入系统性偏差。
常用场景
经典使用场景
非洲涂阳肺结核治疗成功率数据集(africa-who-smear-positive-tuberculosis-treatment-success-rate)源自世界卫生组织全球卫生观察站,覆盖1994至2011年间47个非洲国家的年度观测数据。该数据集在流行病学与公共卫生领域常被用于构建时间序列预测模型、进行国家间疗效对比分析,以及评估结核病控制策略的长期成效。研究人员可借此挖掘区域治疗成功率的时空演变规律,识别影响疗效的关键社会与卫生系统因素。
解决学术问题
这一数据集有效填补了非洲大陆在结核病治疗效果量化研究方面的数据空白,解决了长期以来缺乏标准化、跨国家可比面板数据的困境。学术界借助该数据集得以开展纵向因果推断研究,探讨卫生政策改革、抗结核药物引入与治疗成功率之间的潜在关联。其价值在于提供了验证干预措施有效性的实证基础,推动了全球结核病防控目标的科学评估与区域健康不平等问题的量化分析。
实际应用
在实际应用中,该数据集为非洲各国卫生部门及国际组织(如WHO、非洲疾控中心)提供了数据驱动的决策支持。通过监测治疗成功率的时间趋势,各国可识别疗效薄弱的地区和时段,优化医疗资源配置并调整治疗方案。此外,该数据还服务于结核病防治项目的绩效评价、跨国协作成效跟踪,以及针对涂阳肺结核患者管理路径的改进设计,助力实现终结结核病流行的全球目标。
数据集最近研究
最新研究方向
该数据集聚焦于非洲国家涂阳肺结核治疗成功率的时间序列追踪与区域健康治理评估,为联合国千年发展目标(MDGs)中结核病防控指标提供量化基础。当前前沿研究倾向于结合机器学习模型(如时序预测与分类算法),对1994–2011年间47个非洲国家的治疗成功率进行动态建模,以识别地理异质性与干预效果差异。结合WHO全球卫生观察站的高频数据更新,该数据集正被用于驱动精准公共卫生决策,尤其在资源匮乏区域评估DOTS策略(直接观察治疗短程化疗)的长期实效。此外,其与气候、迁移等跨领域数据集的联合分析,有望揭示社会生态因素对结核病转归的复合影响,推动“同一健康”框架下的多源数据融合研究。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务