five

electricsheepafrica/africa-who-antenatal-care-attendees-positive-for-syphilis-who-received

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-antenatal-care-attendees-positive-for-syphilis-who-received
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)关于非洲国家在2010年至2024年间产前护理中梅毒检测阳性并接受治疗的百分比报告(指标代码:PerctreatedANC)。数据集是Electric Sheep Africa项目的一部分,这是一个统一的、适合机器学习使用的非洲数据仓库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,包含一致的架构。所有数值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集覆盖42个非洲国家,总计266行数据,每行数据包括国家代码、年份、数值估计值、置信区间等信息。

This dataset contains country-level observations for the WHO GHO indicator "Antenatal care attendees positive for syphilis who received treatment (%), reported" (`PerctreatedANC`) across African nations, spanning 2010–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,专注于非洲地区产前保健就诊者中梅毒阳性患者接受治疗的比例(%),涵盖2010至2024年间的42个非洲国家,共266条观测记录。数据以Parquet格式重新打包,采用统一的数据模式,所有数值均取自浮点精度的`NumericValue`字段,而非显示字符串,并尽可能包含置信区间上下限(`value_low`、`value_high`),以确保机器学习的直接可用性。
特点
数据集的核心特点在于其聚焦于非洲区域的产前保健梅毒治疗覆盖率,具有国家层面的年度观测值,且无子维度分层,每个国家与年份组合对应单一数值,便于直接建模。此外,数据还包括了性别、居住地类型等潜在分层信息(如`dim1`、`dim2`),并提供WHO数据更新时间戳,增强了时间序列分析的可靠性。整体上,该数据集为非洲公共卫生领域提供了清洁、标准化且易于整合到机器学习工作流中的结构化数据。
使用方法
用户可通过HuggingFace的`datasets`库轻松加载数据,例如使用`load_dataset("electricsheepafrica/africa-who-antenatal-care-attendees-positive-for-syphilis-who-received")`获取数据集,并将其转换为Pandas DataFrame进行分析。为聚焦国家层面的整体情况,建议过滤出`dim1`字段以`_BTSX`结尾或为空的行,以排除性别或区域分层。针对特定国家的时间序列分析,可通过`country_iso3`字段筛选,例如对肯尼亚数据使用`df[df["country_iso3"] == "KEN"].sort_values("year")`,便于趋势追踪与预测建模。
背景与挑战
背景概述
该数据集由世界卫生组织全球卫生观察站(WHO GHO)于2024年发布,经Electric Sheep Africa重新封装后形成机器学习就绪格式,聚焦于非洲地区产前保健梅毒阳性孕妇接受治疗比例这一公共卫生指标。研究团队从WHO OData API提取2010至2024年间42个非洲国家的年度观测数据,总计266条记录,旨在量化梅毒母婴传播干预措施在非洲大陆的覆盖成效。作为非洲健康领域数据整合的开创性尝试,该数据集为追踪可持续发展目标中消除先天梅毒进展提供了标准化基准,填补了区域级精细化健康指标在机器学习应用中的空白,对评估公共卫生政策效能与指导资源分配具有重要价值。
当前挑战
该数据集所解决的领域问题在于:非洲大陆梅毒母婴传播率居高不下,但缺乏统一、清洁、可供机器学习的治疗覆盖数据,传统统计报告难以支撑预测模型与趋势分析。构建过程中遭遇的挑战包括:原始WHO数据存在多维度分层结构(如性别、居住地类型),需设计通用数据模式兼容异构维度;部分国家年份数据稀疏性显著(266条记录覆盖42国15年),导致建模时面临小样本与不平衡问题;置信区间字段(value_low, value_high)在部分观测中缺失,需决策边界处理策略;此外,从API爬取时需应对可及性限制,并通过ISO代码与区域过滤确保数据集的非洲区域代表性完整性。
常用场景
经典使用场景
该数据集记录了2010至2024年间非洲42个国家产前保健梅毒阳性孕妇接受治疗的比例,是公共卫生领域进行跨区域传染病防控评估的宝贵资源。研究者可将其直接运用于监督学习任务,如回归分析以预测治疗覆盖率的时间演变趋势,或构建分类模型识别治疗率低于警戒线的国家与年份。数据集中提供的置信区间字段还允许进行不确定性量化,使模型评估更贴近真实世界的波动特征。
实际应用
在实际应用中,该数据集可直接嵌入非洲国家卫生部的监测预警系统,帮助公共卫生官员快速识别治疗覆盖率急剧下降的地区并及时调整资源分配。国际组织如世界卫生组织和联合国儿童基金会可借助其中的时序数据追踪可持续发展目标中消除梅毒母婴传播的里程碑进展。此外,面向非洲的AI健康应用开发者可基于此数据训练轻量级预测模型,为基层医疗设施提供治疗需求预估工具。
衍生相关工作
围绕该数据集已衍生出一系列经典工作。Electric Sheep Africa团队将其纳入统一机器学习就绪的非洲健康数据集合,促进了跨指标联合分析与多任务学习。研究社区基于此数据构建了非洲产前保健质量的时序基准模型,用于评估各国卫生系统韧性与政策执行效果。此外,该数据集常与WHO其他传染病指标(如HIV治疗覆盖率、产前检查次数等)协同使用,推动多变量因果推断研究,揭示梅毒治疗与社会经济因素间的深层关联。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务