five

ClimDetect

收藏
arXiv2024-08-29 更新2024-08-30 收录
下载链接:
https://huggingface.co/datasets/ClimDetect/ClimDetect
下载链接
链接失效反馈
官方服务:
资源简介:
ClimDetect数据集由英特尔实验室等机构创建,包含超过816,000个从CMIP6模型集合中提取的历史和未来气候情景的每日快照。数据集经过精心筛选,以促进能够检测每日天气模式中气候变化信号的模型开发。该数据集标准化了气候指纹识别中使用的输入和目标变量,旨在通过提供开放访问的数据和相关分析代码,推动气候科学领域的模型评估和研究,特别是在应用现代机器学习架构如Vision Transformers(ViT)于气候数据分析方面。

The ClimDetect dataset was created by institutions including Intel Labs and others, containing over 816,000 daily snapshots of historical and future climate scenarios extracted from the CMIP6 model ensemble. The dataset has been carefully curated to support the development of models capable of detecting climate change signals within daily weather patterns. It standardizes the input and target variables used in climate fingerprinting, and aims to promote model evaluation and research in climate science—particularly for the application of modern machine learning architectures such as Vision Transformers (ViT) to climate data analysis—by providing open access to the dataset and associated analytical code.
提供机构:
英特尔实验室, 北卡罗来纳大学教堂山分校, 加州大学洛杉矶分校
创建时间:
2024-08-29
搜集汇总
数据集介绍
main_image_url
构建方式
ClimDetect数据集的构建旨在解决气候科学领域中对气候变化的检测和归因问题。该数据集整合了来自耦合模式比较计划第六阶段(CMIP6)模型集的超过816,000个每日气候快照,涵盖了28个不同的气候模型和142个特定的模型集合运行。这些数据来自历史(1850-2014)和共享社会经济路径(SSP2-4.5和SSP3-7.0)的未来情景。数据集的选择旨在强调多样性和平衡,涵盖了具有不同物理特征的模型以及一系列气候强迫情景。所选的气候变量包括地表2米温度(tas)、地表2米比湿(huss)和总降水量(pr),这些都是广泛关注并已在以前的D&A研究中作为重点的气候响应变量。
特点
ClimDetect数据集的特点在于其规模之大和多样性之广,使其成为气候变化检测和归因研究的宝贵资源。数据集的构建考虑到了模型对气候强迫信号的敏感性,通过选择覆盖不同气候敏感性范围的模型来确保数据的全面性。此外,数据集经过预处理,包括去除气候季节循环和标准化异常值,以提高机器学习模型的性能。ClimDetect数据集还包含了训练、验证和测试子集,以支持有效的模型训练、参数调整和性能评估。
使用方法
使用ClimDetect数据集的方法包括将其作为机器学习回归任务的输入。数据集的输入是一个三维矩阵,代表一个64x128的经纬度网格,其中三个通道分别对应tas、huss和pr。模型处理这些输入以预测标量输出AGMT,作为气候强迫信号的代理。数据集的评估指标是均方根误差(RMSE),在测试集(包括历史和SSP245、370模型投影的混合)上进行评估。通过使用ClimDetect数据集,科学家可以更清晰地了解气候动态,从而支持全球应对气候变化的努力。
背景与挑战
背景概述
ClimDetect数据集的创建旨在解决气候变化信号检测和归因的重大挑战。随着全球温度对人为温室气体排放的响应而上升,理解这些变化的驱动因素对于实施有效的缓解和适应策略至关重要。然而,区分人为引起的气候变化信号与自然气候变率一直是传统检测和归因(D&A)方法的挑战。这些方法试图识别气候响应变量中的特定“指纹”。深度学习在分析大规模空间数据集中的复杂模式方面具有潜力。然而,缺乏标准协议阻碍了研究之间的一致性比较。ClimDetect是一个包含超过81.6万个每日气候快照的标准数据集,旨在提高模型在识别气候变化信号方面的准确性。它整合了过去研究中使用的各种输入和目标变量,确保了可比性和一致性。此外,该数据集还探索了视觉转换器(ViT)在气候数据中的应用,这是一种新颖且现代化的方法。ClimDetect的开放访问数据和代码为通过改进模型评估来推进气候科学提供了一个基准。
当前挑战
ClimDetect数据集面临的挑战包括:1) 解决的领域问题,即气候变化信号的检测和归因,需要从自然变率中区分出人为引起的气候信号;2) 构建过程中遇到的挑战,包括确保数据集的多样性和平衡,以涵盖广泛的气候响应变量、强迫指标、自然变率和气候模型。此外,深度学习模型在解释性方面也存在挑战,需要进一步探索和开发新的解释工具。
常用场景
经典使用场景
ClimDetect数据集主要应用于气候变化的检测和归因,通过深度学习技术从大量气候数据中识别气候变化的信号。该数据集包含超过816,000个每日气候快照,涵盖了多种气候响应变量,如气温、湿度和降水量,以及气候强迫指标和自然变化,以及气候模型。这使得ClimDetect成为研究和开发气候变化检测和归因模型的重要工具。
实际应用
ClimDetect数据集的实际应用场景包括但不限于气候变化的预测、气候变化的适应策略制定和气候变化的减缓措施。此外,ClimDetect数据集还可用于教育和研究目的,如数据科学和环境研究。
衍生相关工作
ClimDetect数据集的推出为气候科学领域带来了新的研究方向,推动了气候变化检测和归因技术的发展。此外,ClimDetect数据集还促进了机器学习技术在气候科学中的应用,为未来的研究提供了新的思路和方法。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作