five

electricsheepafrica/africa-who-age-standardized-suicide-rates

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-age-standardized-suicide-rates
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标按年龄标准化的自杀率(每10万人口)(`MH_12`)在非洲国家2000年至2021年间的国家级观测数据。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO GHO OData API获取,并重新打包为具有一致模式的Parquet文件。所有值均来自`NumericValue`(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(`value_low`,`value_high`)。数据集覆盖47个非洲国家,时间跨度为2000年至2021年,总行数为3,102行。数据按子维度(如性别或年龄组)分层,每个国家×年份×维度的唯一组合都会产生单独的行。

This dataset contains country-level observations for the WHO GHO indicator Age-standardized suicide rates (per 100 000 population) (`MH_12`) across African nations, spanning 2000–2021. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available. The dataset covers 47 African nations from 2000 to 2021, with a total of 3,102 rows. When an indicator is stratified (e.g., by sex or age group), each unique combination of country × year × dimension produces a separate row.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲大陆47个国家的年龄标准化自杀率(每10万人口)指标,时间跨度涵盖2000年至2021年。原始数据经过精心清洗与重新打包,以Parquet文件格式呈现,并采用统一的数据模式。所有数值均取自高精度的浮点类型字段`NumericValue`,而非字符串形式的展示值,同时保留了可用的置信区间上下界,确保了数据的准确性与可复用性。
特点
数据集的一大特色在于其多维分层结构,支持按性别(如男女合计、男性、女性)等子维度进行细致剖析,每个国家与年份的组合可能因分层而产生多条记录,用户可通过`dim1`和`dim2`字段灵活筛选所需亚群。此外,数据集涵盖了完整的世卫组织非洲区域47个国家,共计3102条观测记录,并附带了点估计值与置信区间,为流行病学分析与机器学习建模提供了稳健、标准化的基础数据。
使用方法
使用该数据集极为便捷,可借助HuggingFace的`datasets`库直接加载,例如调用`load_dataset("electricsheepafrica/africa-who-age-standardized-suicide-rates")`。加载后,可轻松将其转换为Pandas DataFrame进行后续分析。为获得国家层面且不分性别的总体数据,用户可筛选`dim1`字段中以`_BTSX`结尾或为空的行;针对特定国家的时间序列分析,则可通过`country_iso3`字段进行过滤,并按年份排序,实现高效的数据探索与建模。
背景与挑战
背景概述
该数据集由世界卫生组织(WHO)全球卫生观察站(GHO)提供,经Electric Sheep Africa项目重新整理并发布于HuggingFace平台,聚焦非洲大陆47个国家2000至2021年间年龄标准化自杀率(每10万人)的宏观趋势。自杀作为全球公共卫生领域的重大挑战,尤其在低收入和中等收入国家中愈发受到关注,而非洲地区因数据稀疏、监测体系薄弱,长期缺乏系统、可比的时间序列指标。该数据集通过统一抽取WHO官方OData API中的数值型字段,并整合置信区间边界与性别、居住地类型等亚维度,构建了首个面向机器学习的非洲自杀率结构化数据集,填补了区域健康统计中这一关键指标的开放获取空白。其发布为流行病学建模、健康政策评估及社会决定因素分析提供了可靠的数据基础,对推动全球自杀预防研究的数据公平性具有里程碑意义。
当前挑战
该数据集所解决的领域核心挑战在于非洲自杀率的系统性低估与比较困难:由于各国死因登记制度不完善、文化禁忌对自杀行为的污名化以及数据采集标准不一,传统统计往往忽视隐藏的自杀事件,导致区域真实负担被严重低估。构建过程中遇到的挑战包括:原始WHO数据存在多维度分层衍生出的重复行问题,需通过性别(dim1)等亚类过滤才能提取国家层面的点估计;不同年份与国家间的置信区间覆盖率不一致,部分子集缺失上下限数值,影响后续不确定性量化;此外,部分国家的连续年份观测存在空白,需在缺失数据插补与模型鲁棒性评估间取得平衡。这些数据稀缺与结构异质性对时空建模及跨群体公平性分析提出了严峻考验。
常用场景
经典使用场景
非洲世界卫生组织年龄标准化自杀率数据集(africa-who-age-standardized-suicide-rates)作为全球健康观测领域的一项宝贵资源,汇集了2000年至2021年间47个非洲国家的自杀率数据。该数据集的核心应用在于构建跨国家、跨年代的自杀风险预测模型,研究者可通过年份、性别、国家等特征进行精细化分析,从而揭示非洲大陆自杀行为的时空演变规律。在分类任务中,可利用该数据识别高自杀风险群体;在回归任务中,则能量化社会经济、医疗资源等因素与自杀率之间的关联强度。由于数据经过年龄标准化处理,不同年龄结构的人口之间具有可比性,使得跨国比较研究更加科学可靠,为后续卫生政策评估提供坚实的数据基础。
解决学术问题
该数据集直面非洲地区自杀率研究中长期存在的数据碎片化与可比性不足的困境,统一提供了从世界卫生组织全球健康观测站获取的、经年龄标准化处理的可信指标。学术上,它解决了三个关键问题:一是填补了非洲大陆系统化自杀率统计的空白,使得泛非洲的自杀流行病学研究得以从零散个案走向宏观分析;二是通过收录性别分层数据,揭示了自杀率在不同性别群体中的分布差异,为性别敏感的心理健康干预策略提供理论依据;三是数据集包含置信区间,支持不确定性量化,提升了统计推断的稳健性。这一数据集的开放共享,推动了全球健康不平等研究从描述性分析向因果推断的深化。
衍生相关工作
该数据集的发布催生了一系列具有重要学术影响的衍生工作。基于其结构化格式,研究者已将其与非洲国家发展指数、人均医疗支出、武装冲突数据库等多源信息进行融合,构建了多层次自杀风险综合预测框架。部分工作聚焦于利用时序模型(如ARIMA或长短期记忆网络)开展自杀率的短期预测,为早期预警系统提供算法原型。另有一些研究深入探讨了气候冲击、粮食安全与自杀行为之间的动态关系,揭示了环境变化对心理健康的间接效应。此外,该数据集也被引入机器学习竞赛与跨学科教学案例中,成为培养数据科学家在公共卫生领域应用能力的重要教材。这些工作共同扩展了数据集的应用边界,使其影响力远远超越最初的描述性统计范畴。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作