ChaosBench

arXiv2024-03-02 更新2024-07-31 收录

下载链接：

https://leap-stc.github.io/ChaosBench

下载链接

链接失效反馈

官方服务：

资源简介：

ChaosBench是一个大规模、多通道、基于物理的S2S预测基准，包含超过460,000帧的真实世界观测和模拟数据，每个帧有60个变量通道，时间跨度长达45年。

ChaosBench is a large-scale, multi-channel, physics-based sequence-to-sequence (S2S) prediction benchmark. It comprises over 460,000 frames of real-world observational and simulated data, with each frame containing 60 variable channels and the entire dataset spanning 45 years in total.

创建时间：

2024-02-02

搜集汇总

数据集介绍

构建方式

在次季节至季节气候预测领域，构建一个全面且物理一致的基准数据集面临诸多挑战。ChaosBench的构建过程系统整合了多源数据与物理约束，其核心输入观测数据源自1979年至2023年共45年的ERA5再分析资料，经过重采样至1.5度空间分辨率，并选取每日00UTC时刻的数据，形成了包含60个变量通道、总计超过46万帧的全球观测序列。同时，该数据集纳入了来自美国、欧洲、英国和亚洲四个国家级气象机构在2016年至2023年间生成的物理模式预报，作为数据驱动模型的基准对比。这些预报具有44天的预见期，涵盖48个变量通道。数据集构建的关键创新在于引入了基于物理的评估指标，如谱散度和谱残差，旨在约束模型保持高频信号的物理一致性，从而超越了传统仅依赖视觉指标的基准构建范式。

特点

ChaosBench的显著特征体现在其规模、多样性与物理深度上。该数据集拥有迄今最长的45年时间跨度和最丰富的60个变量通道，提供了涵盖大气多层次的全面状态信息。其空间覆盖为全球尺度，克服了区域性数据集的局限性，能够捕捉S2S尺度上关键的空间-时间关联现象，如遥相关。数据集的一个核心特点是包含了四套独立的业务化物理模式预报作为多元化基准，这为评估数据驱动模型的性能提供了坚实且多样的参照系。尤为突出的是，ChaosBench开创性地整合了可微分的物理约束指标，这些指标直接度量预测结果在谱域上与观测的偏差，推动模型不仅追求视觉相似性，更要维持小尺度结构的物理保真度，从而增强了模型的可解释性与物理一致性。

使用方法

为推进次季节至季节尺度的预测研究，ChaosBench设定了两种具有不同复杂度的核心任务。第一种是完整动力学预测，要求数据驱动模型优化所有60个输入变量通道，以模拟大气的全状态演化，适用于构建替代昂贵数值模式的气候模拟器。第二种是稀疏动力学预测，允许研究者专注于优化一个关键变量的子集，这降低了高维数据带来的学习难度，便于针对特定应用场景（如极端温度或降水预测）进行模型开发与验证。数据集的使用框架支持自回归和直接两种训练策略的比较，前者模拟了物理模式的迭代预报过程，而后者为长期预报技能提供了理论上限。研究者可利用提供的视觉与物理双重指标体系，在统一的基准上系统评估和比较不同数据驱动模型的性能，并探索融入物理约束以提升S2S预测技能的新途径。

背景与挑战

背景概述

在气候变化背景下，次季节至季节尺度（S2S）的精准气候预测对于防灾减灾、经济风险规避和政策制定具有至关重要的意义。然而，由于S2S系统固有的混沌特性，其预测一直是气象学领域的重大挑战。为应对这一难题，来自哥伦比亚大学、加州大学洛杉矶分校等机构的研究团队于近期共同创建了ChaosBench数据集。该数据集作为首个大规模、多通道、基于物理约束的S2S预测基准，整合了长达45年、涵盖60个变量通道的全球观测与模拟数据，并引入了来自四个国家级气象机构的物理模式预报作为基线。ChaosBench的建立旨在弥合现有天气与气候预测基准在预报时效、空间覆盖及物理一致性方面的缺口，为发展兼具高精度与可解释性的数据驱动气候模型提供了关键基础设施。

当前挑战

ChaosBench致力于解决次季节至季节尺度气候预测这一核心领域问题，其面临的首要挑战在于S2S系统对初始条件与边界条件双重敏感所导致的预测技能快速衰减，现有先进模型在44天预报时效上的表现甚至不及长期气候态平均值。在数据集构建过程中，研究团队需克服多重困难：一是整合多源、异构、跨机构的全球观测与模式预报数据，确保长达45年时间序列与60个变量通道在时空维度上的一致性与可比性；二是设计并实现基于物理的评估指标（如谱散度与谱残差），以量化预测结果在频域上的物理一致性，避免模型仅优化视觉相似性指标而产生物理上不可信的平滑化预测；三是建立包含‘完全动力学预测’与‘稀疏动力学预测’的双重任务框架，以平衡模型复杂度与特定应用需求，为不同研究目标提供适配的评估场景。

常用场景

经典使用场景

在次季节至季节尺度气候预测领域，ChaosBench数据集被广泛用于评估和比较基于物理的数值模型与数据驱动模型的预测性能。该数据集通过提供长达45年的全球观测数据与来自四个国家级气象机构的44天预报数据，构建了一个高维视频回归任务框架。研究者通常利用该数据集执行完整动力学预测和稀疏动力学预测两大核心任务，以检验模型在复杂地球系统耦合作用下的长期预测能力，尤其是在捕捉大气变量间非线性相互作用方面的表现。

解决学术问题

ChaosBench主要解决了次季节至季节尺度预测中因系统混沌特性导致的预报技能迅速衰减的学术难题。它通过引入基于物理的评估指标，如谱散度和谱残差，量化了模型在保留高频信号方面的能力，从而揭示了现有数据驱动模型在长时程预测中普遍存在的模糊化现象。该数据集为理解初始条件与边界条件双重敏感性对预测的影响提供了实证基础，并推动了物理约束与机器学习融合的新型预报范式发展。

衍生相关工作

ChaosBench的发布催生了一系列改进次季节至季节预测方法的研究工作。基于其提供的物理约束评估框架，学者们发展了融合谱保持损失函数的神经网络架构，如增强型傅里叶神经算子。同时，该数据集启发了对PanguWeather、GraphCast等先进模型在长时程预测中的泛化能力分析，促进了面向地球系统多圈层耦合的混合建模方法探索。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集