five

electricsheepafrica/africa-who-proportion-of-bloodstream-infection-due-to-escherichia-coli

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-proportion-of-bloodstream-infection-due-to-escherichia-coli
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了非洲国家在2016年至2023年间,由于对第三代头孢菌素耐药的大肠埃希菌引起的血流感染比例的观测数据。数据来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包。数据集包含了22个非洲国家的79行数据,每行数据包括国家代码、年份、数值估计值、置信区间等信息。

This dataset contains country-level observations for the WHO GHO indicator Proportion of bloodstream infection due to Escherichia coli resistant to third-generation cephalosporins (%) across African nations, spanning 2016–2023. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(GHO)的OData API,聚焦于非洲地区大肠杆菌对第三代头孢菌素耐药性引发的血流感染比例。数据经过精心清洗与重构,以Parquet格式统一存储,并采用一致的字段架构,确保机器学习任务的直接可用性。观测值严格取自浮点精度的数值字段,同时附带置信区间上下限,为后续统计分析提供完整支撑。数据覆盖2016至2023年间22个非洲国家的年度记录,共计79条观测样本,均限定于WHO非洲区域(AFRO)范围内。
特点
数据集的核心特点在于其高度专业化与区域聚焦性,专门针对非洲22国的大肠杆菌耐药性血流感染比例这一关键公共卫生指标。每条记录均包含国家ISO代码、年度、点估计值及可信区间,结构简洁却信息丰富,无额外分层维度,便于直接用于分类或回归任务。此外,数据源具备权威性与时效性,来源于WHO官方开放数据,并遵循CC BY 4.0许可,为抗菌药物耐药性监测与建模提供了标准化、可复用的基准资源。
使用方法
通过HuggingFace的datasets库可便捷加载数据,调用`load_dataset`函数即可获取训练集并转换为Pandas DataFrame。使用时可按需过滤:如需国家层面总人群数据,可筛选dim1字段以`_BTSX`结尾或为空的行;针对特定国家的时间序列分析,则依据country_iso3列进行筛选并按年份排序。数据格式为表格型,可直接应用于机器学习模型的训练与评估,亦支持置信区间字段用于不确定性量化分析。
背景与挑战
背景概述
抗菌药物耐药性(AMR)已成为全球公共卫生领域的重大威胁,尤其是大肠杆菌对第三代头孢菌素的耐药性在血流感染中日益严峻。在此背景下,世界卫生组织(WHO)于2023年通过其全球卫生观察站(GHO)发布了“非洲地区因大肠杆菌耐药导致的血流感染比例”数据集,由Electric Sheep Africa团队重新整理并托管于HuggingFace平台。该数据集聚焦于2016至2023年间22个非洲国家的国家层面观测数据,核心研究问题在于量化并监测非洲地区大肠杆菌对第三代头孢菌素耐药性的流行趋势。作为首个面向机器学习友好的非洲AMR数据集,它填补了该地区高质量、结构化耐药性数据的空白,为区域流行病学建模、政策制定及跨国比较提供了关键支撑,对推动全球AMR监测网络完善具有深远影响。
当前挑战
该数据集所解决的领域问题挑战在于:抗菌药物耐药性(AMR)的快速扩散使得常规治疗失效,而非洲地区因监测系统薄弱、数据碎片化严重,难以准确评估耐药性负担并指导干预措施。具体挑战包括:一是构建过程中面临的数据稀疏性,仅有22个国家79条记录,跨时间和空间维度不完整,导致统计推断和机器学习模型易产生偏差;二是数据异质性,不同国家采用不同的诊断标准、报告周期及数据质量,统一整合为可比格式时需谨慎处理缺失值与置信区间;三是缺乏亚组分层信息,如年龄、性别或城乡分布,限制了深入分析耐药性传播的影响因素,从而影响精准公共卫生决策的实施。
常用场景
经典使用场景
该数据集聚焦于非洲地区大肠埃希菌对第三代头孢菌素耐药性引发的血流感染比例,是抗菌药物耐药性(AMR)监测领域的典型时间序列与截面数据。研究者常利用该数据集进行跨国比较分析,评估不同国家在2016至2023年间耐药性演变趋势,或构建回归模型探索耐药性与公共卫生政策、经济发展水平之间的潜在关联。其简洁的指标结构和完整的置信区间字段,为流行病学和健康经济学中的统计推断提供了可靠基础。
实际应用
在实际应用中,该数据集助力非洲各国公共卫生部门监测医疗系统中耐药性大肠埃希菌的流行负担,为临床抗生素使用指南的更新和医院感染控制措施的调整提供数据支撑。同时,它被整合进WHO全球卫生观察站(GHO)的监测框架,服务于国际卫生组织对区域耐药性趋势的追踪与预警,并可作为机器学习模型的训练数据,用于预测未来耐药性爆发风险或评估现有干预措施的效果。
衍生相关工作
基于此数据集,衍生出一系列标志性工作,如对非洲22国耐药性长期趋势的纵向生态分析,以及将耐药性比例与其他社会经济指标(如抗生素消费量、医疗可及性)关联的多变量回归研究。此外,该数据集被用于验证和校准全球AMR预测模型在非洲地区的适用性,并催生了若干公开发布的交互式可视化仪表板,促进了耐药性数据的开放获取与公众认知。作为Electric Sheep Africa项目的一部分,它还推动了面向非洲地区统一、可复用的机器学习数据集标准制定。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务