five

electricsheepafrica/africa-who-transgender-population-size-estimate

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-transgender-population-size-estimate
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标“跨性别者:人口规模估计(数量)”(TG_PSE_NUM)在非洲国家的国家级观察数据,时间跨度为2014年至2023年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO Global Health Observatory OData API获取,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low, value_high)。

This dataset contains country-level observations for the WHO GHO indicator "Transgender: Population size estimate (number)" (`TG_PSE_NUM`) across African nations, spanning 2014–2023. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集依托世界卫生组织(WHO)全球卫生观察站(GHO)的OData API,系统性地采集了非洲16个国家在2014至2023年间关于跨性别者人口规模估计(指标代码TG_PSE_NUM)的国家级观测数据。原始数据经由Electric Sheep Africa项目进行统一清洗与重构,以Parquet文件格式封装,确保架构一致性。数据提取聚焦于浮点精度的数值字段(NumericValue),而非展示字符串,并保留了置信区间上下限(value_low, value_high),为后续统计推断提供了基础。
使用方法
用户可通过HuggingFace的datasets库直接加载数据集,调用load_dataset函数即可获取训练集并转换为pandas DataFrame进行后续分析。典型应用包括筛选特定性别(如双性群体)或居住地类型的子集,或按国家代码提取时间序列数据。此外,数据集结构清晰,易于扩展至回归或分类任务,适用于跨国比较、趋势分析及机器学习建模等场景。
背景与挑战
背景概述
该数据集源自世界卫生组织(WHO)全球卫生观察站(GHO),由Electric Sheep Africa团队整理并发布在HuggingFace平台上,时间跨度为2014至2023年。其核心研究问题聚焦于非洲地区跨性别群体的人口规模估计,旨在通过标准化、机器友好的格式提供国家级的量化数据,以填补该区域在性少数群体健康关怀与政策制定中关键统计指标的空白。凭借对16个非洲国家22条观测记录的整合,数据集为流行病学分析、卫生资源分配及社会公平性评估提供了基础性参考,推动了WHO向实现全民健康覆盖目标的非洲区域性研究。
当前挑战
该数据集面临的挑战首先在于所解决的领域问题,即在非洲公共卫生体系中,跨性别群体的人口规模估计长期缺乏可靠统计,导致相关健康服务规划的精准性受损,社会边缘化现象难以量化呈现。其次是构建过程中遭遇的挑战,包括原始数据来源分散且格式不统一,仅16国提供数据使得覆盖范围有限,加之置信区间数据存在缺失,削弱了模型训练的全面性与推断的稳健性。此外,低样本量(n<1K)对机器学习算法的泛化能力构成了严峻考验,限制了在非洲大陆乃至全球尺度上的应用推广。
常用场景
经典使用场景
该数据集聚焦于非洲国家跨性别者人口规模的点估计值,源自世界卫生组织全球卫生观察站(WHO GHO)的官方指标。其经典使用场景在于为公共卫生研究提供标准化的定量依据,研究者可直接调用点估计值与置信区间进行跨国家、跨年度的比较分析,尤其适用于探究非洲地区跨性别者人群的地理分布特征与时间变化趋势。借助统一的Parquet格式与简洁的列式结构,该数据集在机器学习流程中可作为回归或分类任务的输入,服务于对跨性别者人口规模的预测建模与影响因素挖掘。
解决学术问题
在学术研究层面,该数据集着力解决非洲跨性别者人群被系统性低估与数据缺失的困境,为人口健康评估提供了稀缺的官方统计数据。它弥补了现有全球健康数据库中非洲地区性少数群体信息的空白,使研究者能够量化跨性别者群体的服务需求规模,评估HIV/AIDS等传染病防控政策的覆盖缺口,并进行多国间的基准比较。其高价值在于将隐匿于宏观统计之下的边缘人群显性化,为循证公共卫生决策提供了不可或缺的基础支撑。
实际应用
在实际应用场景中,该数据集助力各国卫生部门与非政府组织精准规划跨性别者友好型医疗资源,例如预判抗逆转录病毒药物的需求量、设计针对性健康教育项目的覆盖范围。结合其置信区间信息,政策制定者可更科学地评估资金分配优先级,避免资源错配。此外,数据集的机器友好特性使其能无缝嵌入监测仪表板与自动化报告系统,支持对非洲区域卫生目标的实时追踪与动态调整。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区跨性别群体人口规模估计的量化研究,是世卫组织全球卫生观察站(GHO)中一项关键指标(TG_PSE_NUM)的汇总。在公共卫生领域,跨性别群体因社会边缘化与结构性歧视,长期缺乏可靠的人口统计数字,而这恰是制定包容性健康政策、分配医疗资源与监测艾滋病等传染病流行率的基石。近年来,随着全球对性少数群体人权与健康权益关注的升温,尤其在非洲多国面临法律模糊性与社会污名化的背景下,此类精细化数据显得弥足珍贵。该数据集覆盖2014至2023年间16个非洲国家的年度观测值,并附带置信区间,为量化跨性别群体的生存规模、追踪时间演化趋势提供了前所未有的机器可读资源,直接支撑着对“消除健康不平等”这一全球热点议题的实证分析,推动了从定性呼吁向数据驱动的政策转变,其意义在于填补了非洲地区性少数群体健康统计的系统性空白。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作