five

electricsheepafrica/africa-who-sex-workers-population-size-estimate

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-sex-workers-population-size-estimate
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在2011年至2023年间关于性工作者人口规模估计的WHO GHO指标数据。数据来源于WHO Global Health Observatory的OData API,并以Parquet文件格式重新打包,具有一致的架构。所有数值均来自浮点精度字段NumericValue,而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集覆盖45个非洲国家,总行数为131行,区域筛选为WHO AFRO(ParentLocationCode = AFR)。

This dataset contains country-level observations for the WHO GHO indicator "Sex workers: Population size estimate (number)" (`SW_PSE_NUM`) across African nations, spanning 2011–2023. It is part of the [Electric Sheep Africa](https://huggingface.co/electricsheepafrica) collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源于世界卫生组织全球卫生观察站(GHO)的开放数据接口,聚焦于非洲地区性工作者人群规模估计这一关键公共卫生指标。数据通过OData API直接获取,并经过统一格式的重新封装,以Parquet文件形式呈现。所有数值均取自原始API返回的浮点精度字段NumericValue,而非经过格式化处理的显示字符串,同时保留了置信区间上下界信息。数据集覆盖2011年至2023年间45个非洲国家的131条观测记录,每一条记录对应一个国家在特定年份的唯一估计值,未进行分层细分,确保了数据结构的简洁与一致性。
使用方法
使用该数据集极为便捷,借助HuggingFace的datasets库即可直接加载,并转换为Pandas数据框以进行后续分析。用户可以通过过滤dim1字段中后缀为_BTSX的行来获取两性合并的国家层面数据,或按国家代码筛选特定国家的历年时间序列。数据集提供了完整的数值列,包括点估计值及其置信区间,可被直接用作回归模型的目标变量。所有操作均可通过Python环境快速完成,无需额外数据清洗或格式转换,显著降低了从原始数据到可分析状态的时间成本。
背景与挑战
背景概述
该数据集源自世界卫生组织全球卫生观察站(WHO GHO),由Electric Sheep Africa团队整理并发布于HuggingFace平台,创建时间约为2023年。其核心研究问题聚焦于非洲地区性工作者人口规模估计(SW_PSE_NUM),涵盖2011至2023年间45个非洲国家的131条观测数据。该数据集填补了非洲公共卫生领域在关键脆弱人群量化数据上的空白,为HIV/AIDS流行病学建模、干预资源分配及政策制定提供了科学依据。作为首个面向机器学习全流程的非洲性工作者人口规模数据资源,它推动了数据标准化与跨区域比较分析,对区域健康不平等研究和全球健康治理具有显著影响力。
当前挑战
该数据集所解决的领域挑战在于,性工作者作为隐匿性人群,传统人口普查难以获取其真实规模,导致健康干预缺乏精准基数。具体而言,数据集面临多重挑战:一是数据稀疏性,仅131条记录覆盖45国13年,时间序列不连续,限制了趋势分析与预测模型的稳健性;二是置信区间不完整,部分国家/年份缺失value_low和value_high字段,增加了不确定性量化难度;三是构建过程中需整合WHO OData API的多源非结构化数据,并处理维度连接(如性别、居住地类型)与跨版本一致性,确保机器学习就绪的干净格式。
常用场景
经典使用场景
在人口健康与流行病学研究中,非洲性工作者人群规模估计数据集(africa-who-sex-workers-population-size-estimate)扮演着不可或缺的角色。该数据集汇聚了2011至2023年间45个非洲国家的国家级观测数据,提供了性工作者人口规模的数值估计及其置信区间,为公共卫生领域的量化分析提供了坚实的数据基础。研究者常将其用于时空趋势分析,借助时间序列模型探索性工作者人口规模在非洲大陆的演变规律,或结合社会经济变量进行多因素回归,揭示人口流动、政策干预与健康行为之间的深层关联。此外,该数据集还广泛服务于贝叶斯统计推断与空间流行病学研究,助力构建区域健康风险的预测模型。其标准化的格式与完整的覆盖范围,使得它成为机器学习任务中监督学习与回归分析的理想训练材料,推动了非洲地区健康数据科学的发展。
解决学术问题
该数据集的问世,有效回应了非洲艾滋病防控研究中长期存在的关键性学术难题——即性工作者人群的规模估算与健康干预效果的量化评估。在传统的流行病学实践中,性工作者作为隐蔽人群,其真实分布与动态变化往往难以捕捉,导致疾病传播模型缺乏精准参数。此数据集通过提供权威的WHO全球卫生观测数据,为艾滋病病毒传播动力学模型、干预策略的成本效益分析以及群体免疫阈值计算提供了不可或缺的基线信息。它使得研究者能够突破数据稀缺的瓶颈,深入探讨性工作者的健康服务可及性、社会行为干预的覆盖度以及政策实施对疾病负担的实际影响,从而为基于证据的公共卫生决策提供了科学支撑。在学术层面,该数据集促进了跨学科研究融合,推动了健康地理学、计量经济学与机器学习方法在非洲健康议题中的创新应用。
实际应用
在实际应用层面,该数据集已成为非洲多国卫生部门与国际组织制定精准健康干预策略的重要数据依托。国家疾病控制机构借助这些人口规模估计值,合理规划艾滋病检测与抗病毒治疗资源的区域分配,提升关键人群的健康服务覆盖率。非政府组织则利用数据中的时空维度和置信区间,优化外展服务点的布局,针对人口集中区域实施定向预防教育,有效降低感染风险。在政策评估领域,世界卫生组织与联合国艾滋病规划署将该数据集嵌入国家健康统计系统,监测性工作者干预项目的实施进展与效果差异,推动各国调整社会政策以消除健康不平等。此外,数据科学团队基于该数据构建预警模型,实时追踪人口规模突变,辅助应急响应与资源调配。这些实际场景中的深度应用,充分释放了数据在完善公共卫生体系、降低疾病传播风险等方面的巨大潜力。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区性工作者人群规模估计的时序动态与空间分布格局,为全球公共卫生领域的前沿研究提供了关键的数据支撑。在艾滋病防控、性传播疾病干预策略优化以及边缘人群健康权益保障等热点议题中,精确的人群基数估计是制定资源分配政策与实施精准干预的基石。借助该数据集,研究者得以探索不同非洲国家在2011至2023年间性工作者人群规模的变化趋势,并通过置信区间捕捉估计的不确定性,从而深化对人口流动、社会政策变迁及流行病学动态之间复杂关联的理解。这一工作不仅有助于评估现有健康干预措施的有效性,也为推动基于证据的公共卫生决策、减少健康不平等现象提供了重要的数据基础设施。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务