five

electricsheepafrica/africa-who-sex-workers-condom-use

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-sex-workers-condom-use
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察指标“性工作者:避孕套使用百分比”(SW_CONDOMUSE_PERCENT)在非洲国家的国家级观察数据,时间跨度为2011年至2023年。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator "Sex workers: Condom use (percent)" (`SW_CONDOMUSE_PERCENT`) across African nations, spanning 2011–2023. It is part of the [Electric Sheep Africa](https://huggingface.co/electricsheepafrica) collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
本数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区性工作者安全套使用率的百分比指标(SW_CONDOMUSE_PERCENT)。数据经过系统化采集与重新封装,以Parquet格式呈现,并遵循一致的数据模式。所有数值均源自高精度的NumericValue字段,而非显示字符串,同时保留了可用的置信区间上下限(value_low、value_high),以确保统计严谨性。该数据集隶属于Electric Sheep Africa项目,旨在构建一个统一且便于机器学习应用的非洲数据资源库,覆盖46个非洲国家、2011年至2023年间共计147条观测记录。
特点
该数据集的独特之处在于其聚焦于特定公共卫生指标,即性工作者安全套使用率,为非洲区域的政策制定与干预评估提供了关键量化基础。数据经过严格的区域筛选,仅包含WHO非洲区域(AFRO)的观察值,确保了地理与人口特征的针对性。尽管不含子维度分层,但每条记录均包含完整的时间序列与国别标识,支持纵向分析与跨国比较。此外,置信区间的引入增强了数据的统计可信度,而标准化的模式与Parquet格式则大幅降低了预处理门槛,适合直接用于回归或分类等机器学习任务。
使用方法
使用该数据集时,推荐通过HuggingFace的datasets库进行加载,调用load_dataset函数即可获取训练集,并支持转换为Pandas DataFrame便于后续操作。若需分析总体水平,可依据dim1字段过滤出两性合并(BTSX)或空白值的记录。对于特定国家的时间序列探索,可利用country_iso3字段筛选并排序年份。数据模式清晰,包含indicator_code、year、value_numeric等核心列,用户可直接以value_numeric作为机器学习目标变量,或结合置信区间进行不确定性建模。典型的应用场景包括趋势预测、区域比较及健康指标回归分析。
背景与挑战
背景概述
该数据集由Electric Sheep Africa团队于2023年整理发布,源数据来自世界卫生组织全球卫生观测站(WHO GHO),核心指标为非洲国家性工作者安全套使用百分比(SW_CONDOMUSE_PERCENT),覆盖2011至2023年间46个非洲国家的147条观测记录。性工作者的健康权益一直是全球公共卫生领域的薄弱环节,尤其在艾滋病防控中,安全套使用率作为关键行为指标,直接关联着疾病传播风险的评估与干预政策的制定。该数据集以统一架构的Parquet格式呈现,不仅保留了数值估计与置信区间,还整合了国家、年份等多维信息,为机器学习驱动的非洲健康政策模拟提供了高质量、可复用的结构化基础,推动了区域流行病学从描述统计向预测建模的范式迁移。
当前挑战
该数据集所面对的领域挑战在于,性工作者群体常因社会污名化与法律边缘化而难以被准确抽样,导致传统调查数据存在系统性偏差,使得安全套使用率这一关键指标在时空维度上的真实波动难以捕捉。构建过程中的挑战则源于多源异构数据的整合:WHO GHO原始API返回的字段包含多种显示格式与缺失值,需精确解析浮点数值而非字符串;同时,不同年份各国上报的数据粒度不一致,部分观测缺乏置信区间或分层维度信息,迫使处理流程需设计鲁棒的填充与过滤策略,以平衡数据完整性与分析灵活性,最终在仅147条记录的小样本约束下,仍需支持可靠的跨地区、跨时间推断。
常用场景
经典使用场景
该数据集为非洲地区性工作者安全套使用率的时空变化提供了标准化、机器可读的观测记录,覆盖2011年至2023年间46个非洲国家的147条国家-年份级数据。研究者可借此追踪各国在性健康干预措施上的实施成效,将安全套使用率作为关键指标,评估艾滋病及其他性传播疾病预防策略在重点人群中的覆盖效果。数据中附带的置信区间信息更便于开展稳健的统计推断与跨群体比较。
实际应用
在公共卫生实践中,该数据可支持非洲各国卫生部门动态监测避孕套分发项目的阶段性成效,识别服务覆盖薄弱的地理区域,并配合UNAIDS的90-90-90目标进行进度评估。非政府组织能够利用这些数据优化资源调配方案,在安全套使用率持续偏低的地区优先加强健康教育、获取渠道改善等针对性行动,从而提升艾滋病综合防控措施的资源投放效率。
衍生相关工作
基于该数据集已衍生出一系列相关研究,包括利用时间序列模型预测性工作者群体中安全套使用趋势的预测性流行病学研究,以及结合社会经济指标(如教育程度、城镇化率)分析结构性决定因素的多元回归分析。此外,该数据还被用于验证同伴教育干预模式、移动健康干预等创新策略在提升安全套使用率方面的有效性对照研究,为全球健康数据标准化与开放科学的实践提供了可复用的范例。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务