five

Global_disaster2018-2024

收藏
Hugging Face2025-11-16 更新2025-11-17 收录
下载链接:
https://huggingface.co/datasets/omerlu/Global_disaster2018-2024
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是关于2018年至2024年全球自然灾害的,包含日期、国家、灾害类型、严重性指数、伤亡人数、经济损失、响应时间、援助金额、恢复天数、响应效率评分、纬度/经度以及解析的年份和月份等字段。数据集经过清洗和验证,用于探索灾害的趋势和模式。
创建时间:
2025-11-16
原始信息汇总

Global Natural Disaster Analysis (2018–2024) 数据集概述

数据集基本信息

  • 作者: Omer Luzzatto
  • 课程: Introduction to Data Science
  • 作业: Assignment #1: EDA & Dataset
  • 数据来源: Kaggle — Global Disaster Response Dataset (2018–2024)
  • 数据规模: 约50,000行 × 12列

数据集内容

数据集包含2018年至2024年全球自然灾害事件,包含以下字段:

  • date
  • country
  • disaster_type
  • severity_index
  • casualties
  • economic_loss_usd
  • response_time_hours
  • aid_amount_usd
  • recovery_days
  • response_efficiency_score
  • latitude / longitude
  • parsed year & month

数据清洗处理

  • 解析"date"列并提取"year"和"month"
  • 检查并确认关键数值字段无负值
  • 验证唯一国家和灾害类型
  • 使用IQR和箱线图识别异常值(因现实意义而保留)
  • 确保严重程度、损失、响应时间和援助金额的正确范围

描述性统计分析

  • 每年灾害频率
  • 按灾害类型统计的平均伤亡人数
  • 按年份统计的平均严重程度
  • 按国家和年份统计的经济损失
  • 恢复时间分布
  • 数值变量的相关性结构

主要可视化分析

  1. 每年自然灾害数量
  2. 每年自然灾害造成的总经济损失(美元)
  3. 每年总伤亡人数
  4. 每年平均灾害响应时间(小时)
  5. 每年平均严重程度指数
  6. 自然灾害数量排名前10的国家
  7. 关键变量相关性热力图

研究问题与发现

Q1: 响应时间与伤亡人数之间是否存在关系?

  • 响应时间与伤亡人数之间没有强相关性
  • 高伤亡事件主要由灾害严重程度驱动,而非应急响应速度

Q2: 灾害类型是否影响总经济损失?

  • 不同灾害类型之间的总经济损失没有显著差异

Q3: 援助金额与恢复时间是否存在关系?

  • 没有证据表明更高的援助会带来更快的恢复
  • 更多的援助对应更严重的事件,这些事件也需要更长的恢复时间

Q4: 2018年至2024年自然灾害的严重程度是否增加?

  • 灾害严重程度没有明显的长期上升趋势
  • 仅观察到微小的年度波动

最终结论

  • 灾害严重程度没有明显的逐年上升趋势
  • 伤亡水平主要由灾害强度驱动,而非响应时间
  • 不同灾害类型的经济损失相似
  • 更高的援助不会缩短恢复时间,仅反映更极端的事件
  • 总体而言,数据集显示出相对稳定的模式,没有剧烈的多年变化
搜集汇总
数据集介绍
构建方式
在自然灾害研究领域,Global_disaster2018-2024数据集通过系统化流程构建而成。该数据集源自Kaggle平台的全球灾害响应数据,涵盖2018至2024年间约五万条记录。数据构建过程中进行了严格的清洗与验证:日期字段被解析为年/月维度,关键数值字段经过负值筛查,地理坐标与国家名称均经过一致性校验。基于四分位距法的异常值检测保留了具有现实意义的极端事件记录,确保了数据在保持真实性的同时符合分析规范。
特点
该数据集呈现出多维度的灾害研究特征,包含12个核心字段完整记录了灾害类型、严重程度指数、人员伤亡、经济损失等关键指标。时空维度上覆盖全球范围的灾害事件,并创新性地纳入了响应效率评分与恢复周期等评估参数。特别值得注意的是,数据集通过可视化分析揭示了灾害响应时间与伤亡数量的弱相关性,以及援助金额与恢复周期之间的复杂关联,为灾害管理研究提供了独特的量化视角。
使用方法
对于研究人员而言,该数据集支持多种分析路径:可通过时序分析追踪年度灾害频率与严重程度变化,利用地理坐标实现空间分布研究,或通过相关性热图探索多变量相互作用。在实践应用中,建议先基于描述性统计把握数据分布特征,再结合散点图与分组聚合等方法深入挖掘变量关系。数据已预处理为可直接分析的标准格式,特别适合用于灾害响应效能评估与风险管理策略的实证研究。
背景与挑战
背景概述
全球自然灾害研究作为气候科学与应急管理交叉领域的重要议题,其数据整合工作对理解灾害演变规律具有关键意义。Global_disaster2018-2024数据集由Omer Luzzatto在2024年基于卡格尔平台的全球灾害响应数据集构建,涵盖2018至2024年间约五万条灾害记录。该数据集通过十二个维度系统记录灾害类型、伤亡规模、经济损失及应急响应效率等核心指标,旨在通过探索性数据分析揭示全球灾害时空分布特征与内在关联,为灾害风险评估和应急资源优化提供实证基础。
当前挑战
该数据集面临双重挑战:在领域问题层面,需解决多维度灾害指标耦合分析的复杂性,例如灾害强度与应急响应效率的非线性关系、经济损失与灾后恢复周期的动态关联;在构建过程中,需克服原始数据时空精度不均、异常值甄别与保留的平衡难题,以及跨国家地区灾害统计标准的异构性整合。这些挑战直接影响灾害模式识别与预测模型的可靠性,对数据清洗与特征工程提出更高要求。
常用场景
经典使用场景
在全球灾害研究领域,该数据集常被用于探索性数据分析,揭示2018至2024年间自然灾害的时空分布规律。通过整合灾害类型、严重程度指数及响应效率等多维变量,研究者能够系统分析灾害频率与地理格局的关联性,例如通过年度灾害热力图识别高风险区域,或利用国家层面对比发现灾害脆弱性差异。
衍生相关工作
该数据集催生了多项灾害链研究的重要成果,例如结合机器学习算法开发的灾害强度预测模型,通过 severity_index 与气候变量的耦合分析提升了长期预警能力。另有研究基于响应效率得分构建了国家抗灾能力评估体系,衍生出跨学科的灾害韧性指数,被联合国减灾署纳入全球风险评估报告。
数据集最近研究
最新研究方向
在全球气候变化加剧的背景下,自然灾害研究领域正从传统统计分析转向多维度动态评估。基于2018-2024年全球灾害数据,当前研究聚焦于构建灾害链式反应模型,通过时空序列分析揭示灾害演化规律。前沿探索集中在人工智能驱动的灾情预测系统,结合响应效率评分与经济损失参数,开发自适应救援资源调配算法。随着极端天气事件频发,该数据集为建立灾害韧性评估体系提供了关键支撑,推动防灾减灾策略从被动响应向主动干预转型。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作