electricsheepafrica/africa-who-estimates-of-rates-of-homicides-per-100-000-population
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-estimates-of-rates-of-homicides-per-100-000-population
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标“每10万人口凶杀率估计”(`VIOLENCE_HOMICIDERATE`)在非洲国家2000年至2021年的国家级观察数据。数据来源于WHO全球健康观察站OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自`NumericValue`字段(浮点精度),而非显示字符串。在可用的情况下,还包括置信区间边界(`value_low`,`value_high`)。数据集覆盖47个非洲国家,共3,102行数据,并按性别等维度进行分层。
This dataset contains country-level observations for the WHO GHO indicator "Estimates of rates of homicides per 100 000 population" (`VIOLENCE_HOMICIDERATE`) across African nations, spanning 2000–2021. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available. The dataset covers 47 African nations with 3,102 rows and is stratified by dimensions such as sex.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
本数据集源自世界卫生组织全球卫生观察站(WHO GHO)的开放数据接口,聚焦非洲地区2000至2021年间每10万人口他杀率这一关键指标。原始数据经由OData API采集后,被重新整理为统一的Parquet格式,并融入Electric Sheep Africa数据仓储体系。构建过程中,严格提取浮点精度的数值字段作为分析核心,同时保留置信区间上下限等辅助信息,确保数据在统计建模中的可用性与严谨性。数据集覆盖47个非洲国家,共计3102条观测记录,并依据WHO AFRO区域标准进行地理筛选。
使用方法
使用者可通过HuggingFace的datasets库快速加载数据集,例如执行`load_dataset("electricsheepafrica/africa-who-estimates-of-rates-of-homicides-per-100-000-population")`即可获取训练集并转换为Pandas DataFrame进行后续分析。为聚焦两性合计的国家层面数据,可依据dim1字段筛选以`_BTSX`结尾或为空值的行;若要研究某一国家的时间序列趋势,则可通过country_iso3字段过滤并结合年份排序。这种设计适配从面板回归到分类预测等多种机器学习任务。
背景与挑战
背景概述
该数据集由世界卫生组织(WHO)全球健康观测站(GHO)于2021年创建,并由Electric Sheep Africa团队重新整理发布,聚焦于非洲47个国家在2000年至2021年期间每10万人口的他杀率估计值。作为非洲健康数据标准化与机器学习友好化的重要尝试,该数据集旨在解决区域暴力与公共卫生交叉领域的量化分析问题,为政策制定者、流行病学家和数据科学家提供可靠的时空比较基准。其影响力体现在填补了非洲大陆系统性他杀率数据的空白,支持跨国趋势分析、暴力成因挖掘及健康干预效果评估,尤其在资源有限地区推动了证据驱动的决策。
当前挑战
该数据集面临的核心挑战在于其解决的领域问题:他杀率作为暴力与健康交叉指标,受统计口径差异、数据报告不完整及冲突地区信息缺失影响,难以实现跨国一致性与时间序列的连续性。构建过程中,数据整合需应对WHO API中缺失值、置信区间不完整及性别、居住地等亚维度分层的复杂解析,同时确保47国数据在统一架构下兼容ISO代码与区域分类。此外,机器学习的应用受限于样本量(3102条)与稀疏性,需处理稀疏时间序列的插值问题以及模型应对不平衡地域分布的泛化能力,这对预测非洲暴力风险的实用工具开发构成显著障碍。
常用场景
经典使用场景
该数据集提供了非洲47个国家2000年至2021年间每10万人口他杀率的官方估算值,涵盖性别分层与置信区间信息。经典的使用场景包括构建国家层面的他杀率时间序列模型,用于分析非洲暴力犯罪的历史演变趋势;或者作为回归任务中的目标变量,结合社会经济、教育、医疗等特征数据,探究暴力死亡率的影响因素。研究人员常以此数据集为基础,进行非洲内部区域的横向比较,或评估国际卫生与安全政策的实施效果。
解决学术问题
在学术研究中,该数据集解决了非洲地区暴力死亡率系统性数据稀缺的问题,为全球健康、暴力流行病学、犯罪学及发展经济学等领域的定量分析提供了可靠依据。它使得研究者能够突破以往依赖于局部调查或零散统计的局限,开展跨国面板数据分析,验证暴力犯罪与贫困、不平等、治理质量等宏观变量之间的理论假设。该数据集的长期跨度与一致口径也推动了关于他杀率时间趋势的统计建模,为政策制定提供了科学支撑。
实际应用
在实际应用中,该数据集被公共卫生部门、国际组织及安全研究机构用于监测非洲地区暴力事件的健康负担,指导干预资源的优先分配。例如,世界卫生组织可据此更新区域暴力预防策略,各国政府能够识别高风险时段与人群,制定针对性的社区安全计划。非政府组织在评估援助项目对减少暴力的影响时,也常以此数据集作为基准参考,从而提升项目设计的针对性与评估的客观性。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区每十万人他杀率估计的时序与空间分析,源于世界卫生组织全球健康观察站(WHO GHO)的官方数据,覆盖2000至2021年间47个非洲国家的观测记录。当前前沿研究方向紧密关联于全球暴力与公共卫生安全交叉领域,尤其围绕可持续发展目标(SDGs)中关于减少暴力致死率的具体指标,结合区域冲突、社会经济不平等与治理效能等热点事件,探究他杀率在非洲大陆的动态演变趋势及驱动机制。该数据集为机器学习模型提供了规范化的结构化输入,可支持回归预测、时空聚类及政策效应评估,其完整的人群分层信息(如性别)与置信区间数据提升了分析的科学性与可靠性,对推动非洲公共卫生决策、干预策略优化及跨国比较研究具有深远意义。
以上内容由遇见数据集搜集并总结生成



