electricsheepafrica/africa-who-men-who-have-sex-with-men-condom-use
收藏Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-men-who-have-sex-with-men-condom-use
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含WHO GHO指标男男性行为者:避孕套使用百分比(MSM_CONDOMUSE_PERCENT)在非洲国家的国家级观察数据,时间跨度为2011年至2024年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。
This dataset contains country-level observations for the WHO GHO indicator Men who have sex with men: Condom use (percent) (MSM_CONDOMUSE_PERCENT) across African nations, spanning 2011–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(GHO)的开放数据接口,聚焦非洲地区男男性行为者的安全套使用率(百分比)这一关键公共卫生指标。数据经过系统化采集与工程化处理,从OData API中抓取原始观测值,并统一以Parquet格式存储,确保机器学习场景下的高效加载。所有数值均直接采用浮点精度的原始统计量,而非字符串形式的展示值;同时,在可能的情况下,额外纳入了置信区间的上下界,为不确定性量化提供支撑。数据集涵盖2011至2024年间40个非洲国家的100条国家-年份级别记录,每条记录对应一个独立观测,无额外子维度分层,结构简洁统一。
特点
该数据集的核心优势在于其高度一致的标准化架构与针对非洲区域的精细聚焦。所有记录均遵循统一的模式设计,包含指示符编码、ISO三位国家代码、WHO区域、观测年份、数值估计及其置信区间等关键字段,便于跨国家与跨年份的对比分析。数据仅来源于WHO非洲区域,针对单一指标独立成表,避免了多源异构数据整合时的混淆。此外,数据集已通过开源许可(CC BY 4.0)发布,并附有明确的引用指南,确保了科研再现性与合规使用的便利性。
使用方法
借助Hugging Face的datasets库,用户可一行代码完成数据加载,并直接转换为Pandas DataFrame进行后续分析。使用时建议优先过滤dim1字段为'SEX_BTSX'或缺失值的行,以获取仅含双性别人群的国家级总体估计。针对特定国家的时序分析,可直接通过'country_iso3'列筛选,如'KEN'代表肯尼亚,再按年份排序即可获得时间序列数据。对于需要置信区间的研究,'value_low'与'value_high'列可直接用于误差棒绘制或不确定性建模。
背景与挑战
背景概述
该数据集由世界卫生组织(WHO)全球卫生观察站(GHO)创建,并由Electric Sheep Africa团队整合为机器学习就绪格式,发布于2024年。核心研究问题聚焦于非洲国家男男性行为者(MSM)的安全套使用率,旨在为艾滋病等性传播疾病的预防与干预提供数据支撑。数据集覆盖2011至2024年间40个非洲国家的观测值,共计100条记录。作为一项重要的公共卫生指标,该数据集为流行病学建模、政策评估及健康不平等研究提供了可靠的量化依据,在非洲区域健康数据治理中具有显著影响力。
当前挑战
当前挑战主要体现于领域问题与构建过程两个层面。领域层面,MSM安全套使用率的精准估计面临社会污名化导致的报告偏倚,以及跨文化背景下行为测量的标准化难题,使得干预效果的评估与比较充满复杂性。构建过程中,数据源于WHO OData API的异构接口整合,需处理不同年份、国家间的缺失值和置信区间不一致问题;同时,原始数据的稀疏性(仅100条记录)限制了细粒度分析,而国家层面的聚合也掩盖了区域内部差异,增加了机器学习模型泛化的难度。
常用场景
经典使用场景
在非洲公共卫生研究领域,该数据集的核心价值在于为男男性行为者(MSM)中安全套使用率的长期监测与区域比较提供了标准化、机器可读的量化基础。研究人员常将其用于构建时间序列分析模型,以描绘2011至2024年间40个非洲国家在MSM群体中安全套使用的动态演变轨迹,并借助置信区间字段评估数据不确定性,为后续干预策略的制定提供坚实的实证支撑。
衍生相关工作
该数据集衍生出多项经典工作,包括利用其开发预测模型以估计未来安全套使用趋势,并集成到HIV传播仿真系统中评估“90-90-90”目标达成的可能性。此外,研究者基于此数据构建了多国面板数据集,运用时间序列聚类与因果推断方法,系统评估了不同公共卫生政策(如同伴教育、抗逆转录病毒疗法推广)对安全套使用率提升的异质性效果,为循证决策提供了方法论范例。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区男男性行为者安全套使用率的时空动态监测,其蕴含的流行病学洞见正被前沿研究用于揭示HIV/艾滋病预防干预的覆盖缺口与成效异质性。结合WHO全球卫生观测站持续更新的2011-2024年间40个非洲国家的国别级数据,研究者得以量化安全套使用行为的演变轨迹,并关联同期PrEP推广、抗逆转录病毒治疗普及等热点干预事件。在精准公共卫生框架下,该数据集支撑着机器学习模型对脆弱人群保护性行为预测因子的挖掘,以及区域间资源分配优化策略的制定,为终结艾滋病流行这一全球卫生议程提供了关键的循证决策基础。
以上内容由遇见数据集搜集并总结生成



