five

electricsheepafrica/africa-who-total-density-per-million-population-positron-emission

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-total-density-per-million-population-positron-emission
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在2010-2021年间世界卫生组织全球健康观察站(WHO GHO)指标每百万人口正电子发射断层扫描设备总密度(DEVICES10)的国家级观察数据。数据来源于WHO Global Health Observatory OData API,并以Parquet格式重新打包,所有数值均来自浮点精度字段(NumericValue),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low, value_high)。该数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。

This dataset contains country-level observations for the WHO GHO indicator Total density per million population: Positron Emission tomography (DEVICES10) across African nations, spanning 2010–2021. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区正电子发射断层扫描(PET)设备每百万人口总密度指标(DEVICES10)。原始数据经系统化清洗与重构,以Parquet文件格式统一封装,仅保留浮点精度的数值字段作为核心观测值,并附带回溯置信区间。数据集覆盖2010至2021年间32个非洲国家的年度观测记录,共计71条,通过WHO AFRO区域代码筛选,确保了地域聚焦的精确性。
特点
数据集具有高度结构化与机器学习就绪的特性,每行记录对应特定国家与年份的单一观测值,避免了多维度分层导致的冗余。其列式架构包含指标编码、国家ISO代码、WHO区域、年份、数值估计及置信区间等字段,同时预留了维度类型与取值列以支持潜在的亚组分析。数据规模精炼(n<1K),非常适合小样本回归或分类任务,且完全遵循CC BY 4.0开放许可协议。
使用方法
用户可通过HuggingFace的`datasets`库便捷加载数据集,调用`load_dataset`函数后直接转换为Pandas DataFrame进行分析。典型用法包括过滤出双性人群及国家层面的数据以排除亚组干扰,或按国家代码筛选特定国家的时间序列数据。该数据集直接适用于预测建模、趋势分析及医疗资源密度比较等任务,无需额外预处理即能高效集成至机器学习流水线中。
背景与挑战
背景概述
在精准医学与全球健康治理的交叉领域,医疗成像设备的可及性已成为衡量卫生系统能力的关键指标。正电子发射断层扫描(PET)作为功能分子影像的核心技术,其密度分布直接反映区域放射性药物与高端诊断资源的配置水平。世界卫生组织(WHO)构建的全球健康观察站(GHO)监测体系,通过DEVICES10指标追踪每百万人口PET设备数量,为非洲大陆的医疗技术公平性研究提供了基准数据。Electric Sheep Africa团队于2021年系统整合了WHO原始数据,创建了涵盖32个非洲国家、横跨2010至2021年的机器学习就绪数据集,旨在弥合非洲健康数据碎片化与标准化不足的鸿沟。该数据集不仅服务于资源匮乏地区的健康政策建模,更通过统一Parquet格式与置信区间字段,推动了跨时间序列预测与空间异质性分析的前沿探索。
当前挑战
该数据集面临的核心挑战在于:第一,领域内结构性数据缺失问题。非洲仅32国存在观测记录(共71条),多数国家连年无数据,导致对大陆整体PET密度的时空推断面临严重偏差,亟需开发缺失数据插补与迁移学习策略。第二,多层级异质性干扰。人口密度差异、城乡分布不均以及社会经济地位分化使每百万人口密度指标在解释时混杂效应显著,需通过分层建模或因果推理剥离混淆因素。第三,构建过程中的动态校准难题。WHO数据源于各国自行上报,不同年份的统计口径、设备定义更新及报告延迟导致时间序列非平稳性,需引入贝叶斯框架对齐多源异构时间戳。第四,维度稀疏性挑战。无亚维度细分限制了亚组分析能力,未来需融合电子健康记录与医疗支出调查以丰富上下文特征。
常用场景
经典使用场景
在公共卫生与医学影像学交叉领域,该数据集(africa-who-total-density-per-million-population-positron-emission)作为描述非洲国家每百万人中正电子发射断层扫描(PET)设备总密度的时序指标,其经典使用场景聚焦于评估区域医疗资源配置的公平性与可及性。研究者常借助此数据集构建国家间或年度间的横向与纵向比较模型,以揭示非洲大陆在高端医学成像基础设施方面的分布格局。通过分析32个非洲国家从2010年至2021年的密度变化趋势,该数据集为精准量化医疗资源匮乏程度、识别技术普及瓶颈提供了关键的数据支撑。
衍生相关工作
围绕该数据集衍生出的经典工作涵盖时空建模与资源抬升预测两大方向。在时空分析领域,有研究通过整合设备密度与癌症发病率的多国面板数据,构建了非洲核医学基础设施与肿瘤诊断延迟之间的因果推断框架;另一项流行工作则利用该数据训练轻量级回归模型,以预测2025年前后各国设备密度的收敛性,并识别政策干预效果较好的转型国家。在方法论贡献上,该数据集常被用作验证缺失数据插补算法的基准案例——由于非洲记录的稀疏性,研究者开发了结合人口经济协变量的多级贝叶斯模型,用于填补国家-年份矩阵中的空白条目,这些模型后续被迁移至其他医疗设备(如MRI、CT)的密度预测研究中。
数据集最近研究
最新研究方向
该数据集聚焦于非洲大陆正电子发射断层扫描(PET)设备每百万人口密度的纵向监测,为全球卫生技术分布研究提供了稀有的非洲区域证据。在精准医疗浪潮与全球癌症负担加剧的背景下,Pet成像技术的可及性成为衡量医疗资源公平性的关键指标。该数据覆盖2010至2021年间32个非洲国家,可支持机器学习模型分析低资源环境下高端影像设备分布的社会经济决定因素,并关联流行病学转变中的非传染性疾病诊疗缺口。其纳入WHO GHO标准化指标与置信区间,为验证资源分配不均假设提供了统计基础,推动实现全民健康覆盖(UHC)中技术装备进步的数字化评估。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作