five

electricsheepafrica/africa-who-women-accessing-antenatal-care-services-who-were-tested-for

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-women-accessing-antenatal-care-services-who-were-tested-for
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(GHO)指标接受产前护理(ANC)服务的妇女中接受梅毒检测的比例(%)(`PerctestedANC`)在非洲国家的国家级观察数据,时间跨度为2009年至2024年。这是Electric Sheep Africa系列的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO全球健康观察站OData API获取,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自`NumericValue`(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(`value_low`,`value_high`)。

This dataset contains country-level observations for the WHO GHO indicator Women accessing antenatal care (ANC) services who were tested for syphilis (%), reported (`PerctestedANC`) across African nations, spanning 2009–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观测站(WHO GHO)的OData API,聚焦于非洲地区孕产妇接受产前保健服务时进行梅毒检测的百分比指标(PerctestedANC)。原始数据经由Electric Sheep Africa团队重新整合与封装,形成统一的Parquet文件格式,保留了浮点精度的数值字段(NumericValue)作为核心观测值,并附带了置信区间上下限(value_low、value_high)等辅助字段。数据集覆盖2009至2024年间47个非洲国家的372条记录,每条记录对应一个特定国家与年份的组合,未进行亚维度分层,确保了数据结构的简洁性与一致性。
特点
该数据集具备高度结构化与机器学习就绪的特点,采用统一的字段模式(Schema),包含国家代码(country_iso3)、年份(year)、数值估计(value_numeric)等关键列,便于直接用于分类或回归任务。数据经过严格的区域过滤,仅保留WHO非洲区域(AFRO)的观测,从而聚焦于特定地理背景下的公共卫生议题。此外,数据集提供了非数值的显示字符串(value_display)与更新时间戳(last_updated),增强了数据的可解释性与时效性,尤为适合时间序列分析、跨国家比较或健康指标建模等应用场景。
使用方法
用户可通过Hugging Face的datasets库加载该数据集,调用load_dataset函数即可获取训练集(train),并利用to_pandas方法转换为Pandas DataFrame进行后续分析。针对性别或居住地类型的亚维度筛选,可依据dim1字段进行过滤,例如选取dim1以‘_BTSX’结尾的行以获取两性汇总数据。对于单一国家的时间序列分析,可直接按country_iso3字段筛选并依据year列排序。该数据集与Python数据分析生态无缝衔接,适合与scikit-learn、statsmodels等库配合使用,快速开展回归预测或分类建模工作。
背景与挑战
背景概述
该数据集由Electric Sheep Africa团队于2025年整理并发布,源自世界卫生组织(WHO)全球卫生观测站(GHO)的官方数据,聚焦非洲地区孕妇在产前保健(ANC)服务中接受梅毒检测的比例(指标代码PerctestedANC)。核心研究问题在于量化并追踪非洲各国2009至2024年间梅毒筛查覆盖率的动态变化,以评估区域公共卫生干预成效。数据覆盖47个非洲国家,包含372条观测记录,以统一架构的Parquet文件形式提供,为机器学习驱动的非洲健康不平等分析、时间序列预测及政策效果评估提供了标准化的基础数据集。其影响力在于填补了非洲产前保健质量监测中结构化、可复用的机器学习就绪数据的空白,加速了基于证据的母婴健康决策研究。
当前挑战
该领域面临的核心挑战是,尽管梅毒筛查是预防母婴传播的关键干预措施,但非洲多国存在数据缺口与报告不一致,制约了区域健康趋势的精准建模。数据集构建中遇到的挑战包括:WHO数据更新频率不一,导致时间序列不连续;部分国家缺失特定年份的数值,需依赖置信区间(value_low, value_high)进行不确定性推断;同时,数据分层维度(如性别、居住区域)在部分观测中缺失,增加了跨维度聚合与比较的复杂性。此外,统一不同来源和格式的原始数据为机器学习就绪的Parquet架构,并确保与国家层面的指标逻辑严格一致,也是一项技术挑战。
常用场景
经典使用场景
在非洲公共卫生与流行病学研究中,该数据集被广泛用于构建预测模型,估计各国在特定年份内接受产前保健服务的孕妇中接受梅毒检测的比例。通过时间序列分析与结构化表格回归任务,研究者能够追踪2009至2024年间47个非洲国家在该指标上的动态变化趋势,进而评估梅毒母婴传播防控工作的覆盖广度与进展。
衍生相关工作
该数据集衍生出一系列卓有成效的研究工作,包括构建基于机器学习的筛查率预测模型、识别影响筛查覆盖水平的关键社会经济与基础设施因子,以及开发动态仪表盘以实现非洲全境的实时可视化追踪。部分研究进一步结合其他WHO指标(如产检覆盖率、梅毒治疗率)进行多变量联合建模,深化了对非洲孕产妇健康服务连续性的系统性理解。
数据集最近研究
最新研究方向
聚焦于非洲地区孕产妇保健服务的可及性与质量评估,该数据集围绕“接受产前保健服务的孕妇中接受梅毒检测的比例”这一核心指标,为流行病学监测、全球卫生政策效果评估以及机器学习驱动的健康干预模型提供了关键的时空数据支撑。当前前沿研究方向包括:利用该数据集构建预测模型,以识别梅毒检测覆盖率低的高风险区域和时间趋势;结合其他社会经济、地理与卫生系统指标,分析检测比例与母婴健康结局(如先天性梅毒发病率)之间的关联;以及在资源有限的环境下,探索数据驱动的最优干预策略优化路径。该数据集在WHO GHO框架下标准化,且已封装为ML-Ready格式,显著降低了非洲区域健康数据在人工智能与数据科学领域应用的准入门槛,对助力实现联合国可持续发展目标中关于消除艾滋病、结核病和疟疾等流行病(SDG 3.3)以及确保健康的生活方式(SDG 3)具有里程碑式的意义。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务