five

electricsheepafrica/africa-who-care-seeking-for-children-with-symptoms-of-acute

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-care-seeking-for-children-with-symptoms-of-acute
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标“儿童急性呼吸道感染症状寻求护理的百分比”(WHS4_106)在非洲国家的国家级观察数据,时间跨度为2000年至2024年。数据来源于WHO全球健康观察站的OData API,并以Parquet文件格式重新打包,具有一致的架构。所有数值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据覆盖了45个非洲国家,共计2,331行数据。数据还按教育水平、居住地区类型、性别和财富五分位数等维度进行了分层。

This dataset contains country-level observations for the WHO GHO indicator "Care-seeking for children with symptoms of acute respiratory infection (%)" (`WHS4_106`) across African nations, spanning 2000–2024. It is part of the [Electric Sheep Africa](https://huggingface.co/electricsheepafrica) collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区儿童急性呼吸道感染症状的就医行为百分比(指标代码WHS4_106)。原始数据经过系统性抽取与清洗,将NumericValue字段作为核心数值指标,并保留了置信区间上下限(value_low、value_high)。所有观测值被整理为统一的Parquet文件格式,覆盖2000年至2024年间45个非洲国家的2331条记录。数据集严格限定于WHO非洲区域(ParentLocationCode='AFR'),确保地理聚焦的精准性。
特点
该数据集的关键特征在于其多维分层结构,提供了按教育水平、居住地类型、性别和财富五分位数等子维度划分的细致观测。每一行代表国家、年份与特定分层维度的唯一组合,使得研究人员能够深入分析不同社会人口群体间的就医行为差异。此外,数据列包含标准化的ISO国家代码、WHO区域标识和数值型点估计,便于直接用于机器学习建模和时间序列分析,而置信区间字段则增强了不确定性评估的透明度。
使用方法
研究者可通过HuggingFace的datasets库轻松加载该数据集,调用load_dataset函数即可获得可直接转换为Pandas DataFrame的训练集。典型使用场景包括过滤特定维度(如仅保留男女合并的全国层面数据)或按国家代码提取时序数据。例如,筛选dim1字段以'BTSX'结尾的行即可获取未分性别的总体估计,而对country_iso3列进行条件过滤则能生成单个国家(如肯尼亚)的年度趋势。数据集支持多元回归、分类任务以及群体间对比分析,适用于公共卫生政策评估与流行病学研究。
背景与挑战
背景概述
该数据集源自世界卫生组织全球卫生观察站(WHO GHO),由Electric Sheep Africa团队于2024年重新整理发布,聚焦非洲地区儿童急性呼吸道感染症状的求医行为百分比(指标代码WHS4_106)。急性呼吸道感染是非洲五岁以下儿童死亡的主要病因之一,及时求医行为直接关联疾病预后与生存率。该数据集覆盖2000至2024年间45个非洲国家的2331条观测记录,纳入教育水平、居住地类型、性别及财富五等分等多维度分层信息,为研究健康公平性、卫生系统可及性及政策干预效果提供了跨时空的量化基准。作为机器学习就绪的开放数据资源,它填补了非洲区域儿童健康行为标准化数据的空白,有力支撑了全球健康监测与循证决策研究。
当前挑战
该数据集所解决的领域核心挑战在于量化非洲儿童急性呼吸道感染后求医行为的复杂社会决定因素,突破传统单一指标分析局限,通过多维度分层整合教育、地域、经济等变量,揭示健康服务利用不均的深层结构。数据构建过程中面临显著挑战:非洲多国卫生统计系统薄弱,历史数据缺失与上报延迟导致年份与国别覆盖不均衡;原始WHO OData API接口中数值型字段与展示字符串分离,需严格校验以提取精确浮点估计值;跨国家、跨年度的分类体系差异(如教育级别定义)增加了数据标准化与可比性处理的难度。此外,置信区间界限的不完整提供限制了某些亚组分析的不确定性量化能力,需通过插补或敏感度分析加以缓解。
常用场景
经典使用场景
该数据集聚焦于非洲地区儿童急性呼吸道感染症状后寻求医疗护理的比例,是衡量公共卫生服务可及性与利用效率的关键指标。其最经典的使用场景在于构建监督学习模型,以国家、年份、教育水平、居住区域类型、性别及财富五分组等细粒度特征为输入,预测儿童患病后寻求专业医疗帮助的概率。研究者常利用此数据集对非洲各国进行纵向趋势分析,或横向对比不同社会经济群体的医疗行为差异,从而揭示影响就医决策的深层结构性因素。
衍生相关工作
围绕该数据集衍生了多项经典工作,包括基于时间序列模型(如Prophet、ARIMA)对非洲各国护理寻求比例进行预测与异常检测,以及利用XGBoost、随机森林等算法挖掘教育水平与财富指数对就医行为的交互影响。部分研究进一步结合地理信息系统,将数据可视化为非洲健康地图,揭示区域间的不平等格局。此外,该数据集还催生了多篇探讨医疗行为差异与儿童死亡率关联的流行病学分析,成为跨学科合作研究的重要数据基石。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区儿童急性呼吸道感染症状的求医行为比例,其细分维度涵盖教育水平、居住地类型、性别与财富五等分位,为精准刻画非洲儿童健康服务可及性的不平等格局提供了结构化数据基础。在近期全球健康公平性研究的浪潮中,尤其是后疫情时代对脆弱群体医疗资源获取能力的再审视,这一数据集的价值愈发凸显。研究者可借助其跨年度(2000—2024)与跨国家面板结构,结合WHO非洲区域特有的社会经济与环境风险因子,运用多层次模型或空间计量方法,量化分析求医行为在城乡、性别与财富阶层间的差异动态,并识别影响儿童呼吸系统疾病有效就诊的关键屏障。这些洞见不仅为制定差异化公共卫生干预策略提供实证依据,更呼应了联合国可持续发展目标中关于减少五岁以下儿童可预防死亡的全球承诺。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务