five

electricsheepafrica/africa-who-people-who-inject-drugs-population-size-estimates

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-people-who-inject-drugs-population-size-estimates
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家中注射毒品人群的人口规模估计数据,时间跨度为2011年至2024年。数据来源于WHO Global Health Observatory OData API,并被重新打包为Parquet格式。数据集还包括了数值估计、置信区间边界等信息。这是Electric Sheep Africa项目的一部分,该项目旨在提供一个统一的、适合机器学习使用的非洲数据仓库。

This dataset contains country-level observations for the WHO GHO indicator "People who inject drugs: Population size estimates (number)" (`PWID_PSE_NUM`) across African nations, spanning 2011–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区注射吸毒人群的规模估计(指标代码PWID_PSE_NUM)。数据经过系统化清洗与重组,以Parquet文件格式存储,确保schema统一且可直接用于机器学习流程。所有值均取自原始NumericValue浮点精度字段而非显示字符串,并包含置信区间上下界(value_low, value_high)。数据覆盖2011年至2024年间29个非洲国家的76条观测记录,通过WHO AFRO区域代码(ParentLocationCode = 'AFR')筛选,最终整合为Electric Sheep Africa项目下标准化的开源数据集。
使用方法
使用者可通过HuggingFace datasets库直接加载该数据集,调用load_dataset函数即可获取训练集并转换为pandas DataFrame进行探索。为聚焦国家层级的总体规模,建议筛选dim1字段以'_BTSX'结尾或为空的记录,避免亚组干扰。针对时间序列分析,可依据country_iso3列筛选特定国家并按year排序。数据预定义目标列为value_numeric,可直接作为回归任务输入;若需分类,可基于置信区间设定阈值。推荐结合WHO其它GHO指标或非洲人口数据进行联合分析,以发掘更深层次的公共卫生洞察。
背景与挑战
背景概述
该数据集由世界卫生组织(WHO)全球卫生观察站于2024年发布,并由Electric Sheep Africa团队重新整理,聚焦于非洲29个国家中注射毒品人群的估计规模(PWID_PSE_NUM),时间跨度为2011至2024年。其核心研究问题在于量化非洲地区注射毒品者的群体数量,为公共卫生政策制定、疾病负担评估及干预资源配置提供关键数据支撑。作为WHO官方指标在机器学习领域的结构化呈现,该数据集填补了非洲区域在药物滥用流行病学研究中标准化、可复用数据的空白,对推动健康数据科学在非洲的应用及全球禁毒策略的精准实施具有重要影响力。
当前挑战
该数据集面临的挑战主要体现在两大方面:首先,所解决的领域问题在于注射毒品人群规模估计常因非法行为的隐蔽性、社会污名化及各国监测能力差异而难以准确获取,导致现有估算可能显著低估实际感染风险及HIV、丙肝等疾病传播潜力。其次,构建过程中遭遇数据稀疏性难题,76条观测值覆盖29国,年均数据点不足3个,且置信区间缺失情况普遍,限制了机器学习模型的训练稳定性和泛化能力;同时,数据来源于多国自我报告与调查,存在报告偏差和跨时空间断,进一步增加了建模与推断的复杂性。
常用场景
经典使用场景
该数据集聚焦于非洲地区注射吸毒人群的规模估计,覆盖2011至2024年间29个国家的国家级观测数据。其经典使用场景包括时空动态分析:研究者可借助逐年变化的点估计值与置信区间,追踪不同国家注射吸毒人群规模的演变趋势,揭示疫情热点区域与扩散路径。同时,该数据为构建预测模型提供了结构化基础,适用于时间序列回归或分类任务,以推断未来人口规模变化。此外,通过结合性别、居住地等维度的分层信息,可深入探讨亚人群间的差异,为精准干预策略的制定奠定量化依据。
解决学术问题
该数据集有效解决了非洲地区注射吸毒人群规模估计中数据碎片化与可比性不足的学术难题。它统一整合了世界卫生组织全球健康观察站的多源官方数据,形成标准化的机器可读格式,填补了区域级流行病学监测的空白。借助此数据,研究者能够量化吸毒人群的密度与分布,评估其对传染病传播(如HIV、丙肝)的潜在风险,并检验干预措施的效果。其深远意义在于为全球健康不平等议题提供实证支撑,推动基于证据的政策制定,助力实现联合国可持续发展目标中关于健康福祉的承诺。
实际应用
在实际应用中,该数据集为公共卫生决策者提供了关键的人口规模基准,以指导资源分配与降低危害服务规划。例如,各国卫生部门可依据估计数据优化针具交换、阿片类药物替代疗法等项目的覆盖范围与预算配置。同时,非政府组织和国际援助机构利用这些数据识别高风险社区,设计定向干预方案,提升服务可及性。此外,数据集还支持对历史干预效果的后验评估,帮助调整未来策略,最大化减少注射吸毒带来的健康与社会负担。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区注射吸毒人群规模估算的前沿研究方向,为全球公共卫生领域提供了关键的流行病学数据支撑。近年来,随着非洲大陆毒品滥用问题的日益凸显,尤其是注射吸毒行为与HIV、HCV等血源性传染病传播的紧密关联,该数据集成为评估疾病负担、优化干预资源配置以及推动循证政策制定的核心依据。其覆盖29个非洲国家、横跨2011至2024年的时序数据,不仅揭示了注射吸毒人群规模的动态演变趋势,还为跨国家比较分析、时空建模及机器学习预测提供了高质量输入。结合世界卫生组织全球健康观察站的数据权威性,这一标准化、机器可读的数据集在促进非洲区域健康不平等研究、传染病动力学建模以及可持续发展目标监测中发挥着不可替代的作用,对推动精准公共卫生策略落地具有深远影响。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务