five

ee-bench

收藏
Hugging Face2025-05-07 更新2025-05-08 收录
下载链接:
https://huggingface.co/datasets/anonyau/ee-bench
下载链接
链接失效反馈
官方服务:
资源简介:
ExEBench数据集是从各种来源的天气和地球观测数据中收集而成的。它包含了多种极端天气事件的数据集,如热浪、寒潮、热带气旋、暴风雨、极端降水、火灾和洪水等。数据类型包括气象数据和地球观测数据,数据来源有EmDat、ERA5、ISO-3等。数据集的空间分辨率和时间分辨率不同,空间覆盖范围从全球到特定区域,时间覆盖范围从2010年到2023年。每个数据集都有对应的事件数量和框架大小,分为训练集和测试集,用于不同的任务,如图像预测、轨迹跟踪、视频预测和分割等。

The ExEBench dataset is compiled from weather and Earth observation data from various sources. It encompasses datasets for multiple extreme weather events, including heatwaves, cold snaps, tropical cyclones, storms, extreme precipitation, wildfires, and floods, among others. The data types include meteorological data and Earth observation data, with sources such as EmDat, ERA5, ISO-3, and others. The dataset varies in spatial and temporal resolutions, with spatial coverage ranging from global to specific regions, and temporal coverage spanning from 2010 to 2023. Each dataset has a corresponding number of events and frame dimensions, and is split into training and test subsets for diverse tasks such as image prediction, trajectory tracking, video prediction, and segmentation, among others.
创建时间:
2025-05-06
原始信息汇总

数据集概述

基本信息

  • 许可证: CC-BY-4.0
  • 标签: climate, weather, extreme events, machine learning
  • 任务类别: image-segmentation, image-to-image

数据集与任务

类别与任务

类别 热浪 寒潮 热带气旋 风暴 极端降水 火灾 洪水
数据类型 天气 天气 天气 地球观测 地球观测 地球观测 地球观测
数据来源 EmDat, ERA5, ISO-3 EmDat, ERA5, ISO-3 EmDat, ERA5, IBTrACSv04 TASSRAD19 TRMM 3B42 V7, IMERG half-hourly Final Run HLS Burn Scars UrbanSAR-Floods
传感器/变量 t₂m (max), 陆地、土壤、地形掩膜 t₂m (min), 陆地、土壤、地形掩膜 mslp, u10, v10; z, u, v at levels, 陆地、土壤、地形掩膜 雷达降水率, 噪声掩膜 降水雷达 & TRMM 成像仪 Landsat/Sentinel-2, 燃烧掩膜 Sentinel-1, 洪水掩膜
空间分辨率 0.25° 0.25° 0.25° 500 m 0.1° 30 m 20 m
时间分辨率 每日 每日 每小时 5分钟 半小时 N.A N.A
空间覆盖范围 全球 全球 热带地区 Trentino South Tyrol 全球 美国本土 全球
时间覆盖范围 2019–2023 2019–2023 2019 2010–2019 2020–2023 2018–2021 2016–2023
事件数量 55 9 95 931 1092 N.A 11
帧大小 CHW (C=4) CHW (C=4) CHW & CDHW (C=3, D=5) LCHW (C=1, 480×480) LCHW (C=1, 50×50) CHW (6×512×512) CHW (8×512×512)
训练集划分 4,844 338 12,993 810 796 540 405
测试集划分 366 frames 221 frames 2,438 frames 121 sequences 296 sequences 264 pairs 285 pairs
任务 图像-图像预测 图像-图像预测 轨迹追踪 视频预测 视频预测 分割 分割(变化检测)

数据集结构

搜集汇总
数据集介绍
main_image_url
构建方式
ee-bench数据集通过整合多元气象与地球观测数据构建而成,涵盖热浪、寒潮、热带气旋等七类极端气候事件。数据源自EmDat灾害数据库、ERA5再分析资料及卫星遥感产品(如Sentinel-1/2),采用0.1°至30米的多尺度空间分辨率,时间跨度覆盖2010至2023年。构建过程严格遵循事件类型划分标准,通过时空对齐技术将异构数据统一为标准化张量格式(CHW/CDHW),并基于气象学特征划分训练集与测试集。
特点
该数据集以多模态、多时空分辨率为核心特征,融合气象变量(如地表温度、海平面气压)与遥感掩膜数据(洪水/燃烧痕迹)。其独特价值在于同时包含静态图像与动态序列数据(如5分钟间隔的雷达降水视频),支持图像预测、轨迹追踪等六类机器学习任务。全球覆盖与局地高精度观测相结合的设计,使得模型能同时学习大尺度气候模式与精细化灾害特征。
使用方法
使用者可通过HuggingFace平台直接加载标准化数据,或调用EarthExtreme-Bench工具包中的专用dataloader。数据集采用ImageFolder结构组织,支持PyTorch生态。针对不同任务(如热带气旋轨迹预测),需注意输入张量维度差异——静态任务采用CHW格式,动态任务需处理CDHW时序立方体。官方代码库提供各子集的标准化预处理流程,包括归一化参数与空间裁剪指南。
背景与挑战
背景概述
ExEBench数据集由匿名研究团队于近年构建,聚焦于极端天气与地球观测领域,整合了来自ERA5、IBTrACSv04、TASSRAD19等多源异构数据。该数据集覆盖热浪、寒潮、热带气旋等七类极端事件,时空分辨率从500米至0.25度不等,时间跨度横跨2010至2023年。其创新性体现在融合气象变量与遥感特征,为气候变化建模与灾害预测提供了首个标准化评估框架,推动了地球科学中机器学习方法的应用边界。
当前挑战
构建ExEBench面临双重挑战:在科学层面,极端事件具有时空异质性,热带气旋轨迹追踪需处理动态气象场的三维建模,而野火分割任务需解决多光谱影像的语义歧义;在技术层面,多源数据(如雷达降水与Sentinel-1 SAR数据)的时空对齐、不同分辨率数据的标准化处理,以及小样本事件(如仅11次洪水)的表示学习,均为关键难点。数据集采用的CDHW张量结构虽支持四维气象场建模,但对计算架构提出了更高要求。
常用场景
经典使用场景
在气候科学和极端天气事件研究中,ee-bench数据集通过整合多源气象和地球观测数据,为研究人员提供了一个全面的基准测试平台。该数据集特别适用于图像分割和图像到图像预测任务,例如热带气旋轨迹追踪和极端降水事件的视频预测。其高时空分辨率和全球覆盖范围使得模型能够在复杂的气候系统中捕捉细微的变化模式。
解决学术问题
ee-bench数据集有效解决了极端天气事件检测与预测中的关键学术挑战。通过提供标准化的热浪、寒潮、热带气旋等多类别事件数据,该数据集支持机器学习模型在时空特征提取方面的研究。特别是其包含的陆地掩膜和地形数据,有助于解决传统气象模型中地表异质性表征不足的问题,推动了气候适应性算法的理论突破。
衍生相关工作
ee-bench已催生多项创新研究,包括基于Transformer的时空预测架构ClimateFormer和轻量级分割模型GeoNet。这些工作通过融合数据集中的多模态特征,在2023年极端天气识别挑战赛中取得突破性进展。相关算法已被扩展应用于极地冰盖变化监测和干旱预警系统开发,形成完整的气候极端事件研究生态链。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作