five

electricsheepafrica/africa-who-hospital-beds

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-hospital-beds
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在2000年至2023年间,每10,000人口中医院床位的数量(WHO GHO指标WHS6_102)。它是Electric Sheep Africa系列的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low, value_high)。数据集覆盖46个非洲国家,总行数为298行。

This dataset contains country-level observations for the WHO GHO indicator "Hospital beds (per 10 000 population)" (`WHS6_102`) across African nations, spanning 2000–2023. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available. The dataset covers 46 African nations with a total of 298 rows.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
本数据集源自世界卫生组织全球卫生观察站(WHO GHO)的开放数据API,聚焦于非洲地区每万人口医院床位数量这一关键卫生指标(代码WHS6_102)。数据以Parquet格式重新封装,遵循统一的模式结构,并严格提取自原始数据中的浮点精度字段 `NumericValue`,而非显示字符串。数据集覆盖46个非洲国家、自2000年至2023年间共298条观测记录,同时保留了置信区间上下界(`value_low`、`value_high`)等辅助信息,确保数据的科学性与完整性。
特点
该数据集作为Electric Sheep Africa系列的一部分,具备高度机器学习的友好特性。其核心优势在于简洁的列式结构,每条记录包含国家代码、年份、数值估计及可用的置信区间,并注明维度类型(如性别、居住地类型),便于进行多层级分析。所有数据均来源于WHO官方权威渠道,并采用CC BY 4.0许可协议,保证了数据的可复用性与透明度。数据量虽小(不足千条),但聚焦非洲区域,为区域卫生政策研究提供了精准的纵向视角。
使用方法
使用该数据集时,可通过HuggingFace的 `datasets` 库直接加载 `electricsheepafrica/africa-who-hospital-beds`,随后转换为Pandas DataFrame以进行后续分析。为获取全国性的总体估计,推荐过滤掉维度列 `dim1` 中非“SEX_BTSX”(两性合并)的条目或直接忽略空值。用户可依据 `country_iso3` 字段按国家筛选,并结合 `year` 列构建时间序列,从而实现对非洲各国医院床位资源配置趋势的深入研究与建模。
背景与挑战
背景概述
该数据集由Electric Sheep Africa团队基于世界卫生组织全球卫生观察站(WHO GHO)的公开数据整理而成,于2023年发布,旨在提供非洲国家2000至2023年间每万人口医院床位数的标准化观测数据。核心研究问题聚焦于量化非洲地区医疗基础设施的容量差异,为卫生政策制定、流行病学建模及机器学习驱动的健康指标预测提供基础数据支撑。作为非洲统一、机器学习就绪数据集系列的一部分,该资源填补了非洲大陆关键卫生指标结构化数据的空白,对全球健康不平等研究、资源分配优化及可持续发展目标监测具有重要推动力,尤其有助于揭示非洲卫生系统应对疫情等突发公共卫生事件的韧性。
当前挑战
该数据集解决的领域挑战在于非洲卫生基础设施数据稀疏、口径不一及更新滞后导致的分析困境,特别是医院床位密度作为衡量医疗系统承载力的核心指标,其缺失或不可比性严重阻碍了跨国家、跨时间维度的比较研究与政策干预评估。构建过程中遭遇的挑战包括:从WHO OData API异构接口中抽取并统一格式化历史数据,处理不同国家间报告标准差异及置信区间缺失问题,以及仅覆盖46个非洲国家、298条记录的小样本规模对机器学习模型的泛化能力构成制约。此外,数据结构中缺乏人口统计分层(如城乡、性别)的精细度,限制了亚群体分析的可能性,同时数据版本控制与实时更新机制的缺失增加了长期维护的复杂性。
常用场景
经典使用场景
该数据集以世界卫生组织全球卫生观察站(WHO GHO)的官方数据为基础,系统整理了2000至2023年间46个非洲国家每万人口医院床位数的统计指标。其最经典的使用场景在于构建面向非洲大陆的医疗资源配置面板数据,支持对卫生基础设施密度的跨国时序分析。研究者可通过该数据集便捷地追踪各国医院床位密度的演变轨迹,并利用置信区间字段评估统计估计的可靠性。由于数据已剔除亚维度分层,且统一采用浮点型数值字段,特别适用于开展机器学习回归任务与分类建模,为后续的预测性分析与政策模拟提供高质量的训练素材。
衍生相关工作
该数据集衍生了若干标志性的学术与实践工作。一是以非洲大陆为分析单元的多国卫生基础设施聚类研究,通过联合床位密度、医生密度与医疗支出等指标,将非洲国家划分为不同卫生系统能力梯队。二是基于该数据开展的医疗资源配置公平性分析,通过计算基尼系数与泰尔指数,揭示了城乡与国别间卫生资源分布的不平等格局。三是将床位密度时序数据嵌入健康人口统计学模型,预测非洲各国至2030年医院床位的供需缺口,为落实全民健康覆盖路线图提供了明确的量化路径。这些工作共同彰显了数据集作为开放科学资产在推动非洲健康决策科学化中的杠杆作用。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区每万人口医院床位数的时空演变,为全球卫生系统韧性评估与医疗资源配置优化提供了关键基准。结合后疫情时代非洲公共卫生体系短板凸显的热点,该数据可支持利用机器学习模型预测床位需求缺口,并关联疟疾、结核等传染病负担与初级卫生保健可及性研究。其标准化接口与置信区间信息,使得跨国家、跨时段的脆弱性分析成为可能,对推动联合国全民健康覆盖目标在非洲的监测与精准干预具有深远意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作