electricsheepafrica/africa-who-total-density-per-million-population-radiotherapy-units
收藏Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-total-density-per-million-population-radiotherapy-units
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家在2010年至2021年间关于每百万人口放疗单位总密度的WHO GHO指标数据(指标代码:DEVICES22)。数据来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,具有一致的架构。所有数值均来自浮点精度字段(NumericValue),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集覆盖了41个非洲国家,共99行数据,是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。
This dataset contains country-level observations for the WHO GHO indicator Total density per million population: Radiotherapy units (DEVICES22) across African nations, spanning 2010–2021. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available. The dataset covers 41 African nations with a total of 99 rows.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区每百万人口中放射治疗设备密度的指标(DEVICES22)。数据以Parquet文件格式重新封装,采用一致的架构,确保机器学习就绪。所有观测值均来源于`NumericValue`字段,而非显示字符串,并包含置信区间上下界(如可用)。数据集覆盖2010至2021年间41个非洲国家,共计99条记录,严格限定于WHO AFRO区域。
特点
数据集的核心特点在于其简洁性与针对性:每一条记录对应一个国家与年份的唯一组合,无额外的子维度分层,便于直接用于回归或分类任务。架构中包含丰富的元数据字段,如`value_numeric`作为主要机器学习目标,`value_low`和`value_high`提供不确定性估计,同时保留原始显示字符串与最后更新时间。这种设计兼顾了定量分析与可追溯性,为非洲放射治疗资源分布的研究提供了高质量、标准化的数据基础。
使用方法
使用该数据集极为便捷,可通过HuggingFace的`datasets`库直接加载:`load_dataset('electricsheepafrica/africa-who-total-density-per-million-population-radiotherapy-units')`。返回的`train`分割可转换为Pandas DataFrame进行深入分析。建议过滤`dim1`字段以获取男女合计或国家级别的数据,例如通过筛选以`_BTSX`结尾的值或处理缺失值。此外,可按国家代码(如`KEN`)提取时间序列,用于趋势分析或预测建模。
背景与挑战
背景概述
该数据集由Electric Sheep Africa团队于2021年从世界卫生组织(WHO)全球卫生观察站(GHO)ODaTA接口提取并整理,聚焦非洲地区每百万人中放射治疗设备密度的指标(DEVICES22)。放射治疗设备是癌症治疗的关键基础设施,尤其在低收入和中等收入国家,其分布不均直接制约肿瘤医疗服务的可及性。数据集涵盖2010至2021年间41个非洲国家的99条观测记录,填补了非洲放射治疗资源量化研究的空白。作为公开的机器学习就绪资源,它为卫生政策制定者、流行病学家及人工智能研究者提供了标准化、可复用的结构化数据,助力区域卫生资源分配优化与健康差异分析,推动了非洲健康数据科学的透明化与智能化进程。
当前挑战
数据集所解决的领域核心挑战在于非洲放射治疗资源分布的极端不均衡与数据缺失问题。因经济、基础设施及政治因素,许多非洲国家缺乏系统性的医疗设备普查,导致全球健康研究中长期缺乏精确的国别级放射治疗密度数据。构建过程中的挑战包括:WHO原始API接口数据存在缺失值,部分国家特定年份无有效记录;不同来源数据格式不统一,需进行数值字段清洗与置信区间字段的兼容性处理;此外,数据集规模较小(仅99行),在机器学习中易引发过拟合,需结合其他社会经济特征进行多模态分析方能揭示资源可及性的深层驱动因素。
常用场景
经典使用场景
在非洲公共卫生与肿瘤流行病学的研究版图中,该数据集作为衡量放射治疗资源可及性的核心指标,被广泛用于评估各国每百万人中放射治疗单元的配置密度。研究人员常将其与国家癌症发病率、死亡率数据以及人口统计学特征相结合,构建回归模型或时空分析框架,以揭示资源分配不均背后的驱动因素,从而为区域医疗规划提供量化依据。
衍生相关工作
基于此数据集,衍生出多项聚焦非洲放疗资源可达性与公平性评估的经典工作,包括跨区域时空热点分析、机器学习驱动的放疗需求预测模型,以及将社会经济指标(如人均GDP、医疗支出占比)与放疗密度耦合的归因网络研究。此外,该数据集常与WHO GHO系列中的其他肿瘤服务指标(如CT设备密度、化疗可及性)联合建模,形成综合医疗服务能力指数,为精准分级援助策略奠定数据基础。
数据集最近研究
最新研究方向
该数据集聚焦于非洲国家每百万人中放射治疗设备的密度,为全球肿瘤治疗资源分配与健康公平性研究提供了关键数据支撑。在癌症发病率持续攀升的背景下,放射治疗作为核心治疗手段之一,其设备可及性直接关联患者的生存预后。该数据集的发布赋能研究者量化分析非洲大陆放疗资源的时空分布差异,并启发结合社会经济、基础设施等维度的交叉研究。当前前沿方向包括:借助机器学习模型预测资源匮乏地区的设备需求缺口,评估非传染性疾病防控政策成效,以及推动世界卫生组织“全民健康覆盖”目标在非洲的可实施路径探索。这一数据资源对于识别健康服务盲区、优化国际卫生援助具有深远的现实意义。
以上内容由遇见数据集搜集并总结生成



