CloudCast
收藏arXiv2021-06-16 更新2024-06-21 收录
下载链接:
https://vision.eng.au.dk/cloudcast-dataset/
下载链接
链接失效反馈官方服务:
资源简介:
CloudCast是由奥胡斯大学工程学院创建的一个卫星数据集,专门用于云预测研究。该数据集包含70,080张图像,每张图像都标注了10种不同云类型,覆盖了大气中的多个层次。数据集的空间分辨率为928x1530像素,每像素代表3x3公里,时间间隔为15分钟,数据收集时间为2017年至2018年。CloudCast数据集旨在通过提供高分辨率和高时间分辨率的数据,解决全球云预测方法中数据不足的问题,特别是在机器学习领域的应用。
CloudCast is a satellite dataset developed by the School of Engineering, Aarhus University, specifically for cloud forecasting research. It contains 70,080 images, each annotated with 10 distinct cloud types and covering multiple atmospheric layers. The dataset has a spatial resolution of 928 × 1530 pixels, where each pixel represents a 3 × 3 km area, with a temporal interval of 15 minutes between consecutive images. Data was collected between 2017 and 2018. The CloudCast dataset aims to address the shortage of available data for global cloud forecasting methods, particularly for their machine learning applications, by providing high-spatial-resolution and high-temporal-resolution data.
提供机构:
奥胡斯大学工程学院
创建时间:
2020-07-16
搜集汇总
数据集介绍

构建方式
在气象预测领域,高分辨率云层观测数据的稀缺性长期制约着数据驱动方法的发展。CloudCast数据集的构建依托欧洲气象卫星组织(EUMETSAT)的MSG卫星系统,采集了2017年至2018年间覆盖欧洲区域的70,080幅多光谱卫星图像,时间间隔为15分钟,空间分辨率达3公里每像素。通过应用NWCSAF项目开发的多层云分类分割算法,结合数值天气预报(NWP)数据、地理掩膜及视角几何等辅助信息,对每个像素进行10种云类型的精细标注。数据处理过程包括对短期缺失观测的线性插值补全,并最终发布全分辨率及降采样版本,以支持不同规模的研究需求。
特点
CloudCast数据集在时空分辨率与云层信息深度方面展现出显著优势。其图像序列以15分钟为间隔持续捕捉大气动态,空间覆盖达928×1530像素,实现了对云层运动的高频监测。数据集中包含10种涵盖不同垂直高度的大气云类型,如高透明云、中低云等,且每个像素均经过精确分类,为研究多层云系统的形成与演变提供了细致标注。相较于现有全球云数据集,CloudCast在时间粒度与空间精度上均有所突破,填补了高分辨率、多类型云观测数据的空白,为大气预测模型的验证与优化奠定了坚实基础。
使用方法
该数据集适用于云层运动预测及视频生成等时空深度学习任务。研究者可将其划分为训练集与测试集,以过去连续图像序列作为输入,预测未来数小时的云层分布。数据集中提供的像素级云类型标签支持分类预测模型的训练与评估,同时其高时间分辨率可用于分析云层变化的短期动力学。为便于实验,数据集已提供标准化及降采样版本,用户可根据计算资源选择合适规模。此外,数据格式兼容常见机器学习框架,可结合卷积LSTM、生成对抗网络等模型进行云层演变建模,推动数据驱动的大气预测方法发展。
背景与挑战
背景概述
在气象学领域,云层预报作为现代天气预测系统的核心组成部分,其准确性直接影响气候模型的整体可靠性。由奥尔胡斯大学的研究团队于2021年创建的CloudCast数据集,旨在应对全球范围内高分辨率历史观测数据匮乏的挑战。该数据集基于欧洲气象卫星组织(EUMETSAT)的MSG卫星图像,覆盖2017年至2018年期间,以15分钟间隔提供70,080张像素级标注的多层云类型图像,空间分辨率达928×1530像素(每像素3×3公里)。CloudCast的推出为数据驱动的云层动态研究提供了关键资源,推动了机器学习在气象预测中的应用,弥补了传统数值天气预报模型在时空分辨率上的不足。
当前挑战
CloudCast数据集致力于解决云层类型与运动的精准预测问题,这一领域长期面临云层垂直与水平结构复杂、物理参数化困难等挑战。在构建过程中,研究团队需克服多重障碍:首先,从海量原始卫星数据(约16TB)中提取并标注多层云类型,涉及多光谱通道融合与阈值算法优化,以区分10类云层;其次,处理数据缺失与卫星定期中断(如日凌现象)需通过线性插值确保时序连续性;此外,整合数值天气预报输出以提升低中层云检测精度,增加了数据处理的复杂性。这些挑战凸显了高分辨率气象数据集构建的技术门槛,也为后续模型开发提供了改进方向。
常用场景
经典使用场景
在气象学与计算机视觉交叉领域,CloudCast数据集为云层动态预测提供了高分辨率时空基准。该数据集通过标注多层云类型,支持基于深度学习的视频预测模型,如卷积长短时记忆网络和生成对抗网络,用于模拟未来数小时内云层的形成与演变过程。其经典应用场景在于训练和评估模型在短时临近预报中的性能,为数据驱动的气象预测方法奠定基础。
实际应用
在实际气象业务中,CloudCast数据集可用于提升短时天气预报的准确性,特别是在航空、农业和可再生能源管理等领域。例如,通过预测云层覆盖变化,可优化太阳能发电站的运营调度,或辅助航空管制系统规避恶劣天气。数据集的高分辨率特性使其能够支持精细化天气服务,增强社会应对气象风险的能力。
衍生相关工作
基于CloudCast数据集,多项经典研究工作得以衍生,包括改进的ConvLSTM架构用于降水临近预报,以及多阶段动态生成对抗网络在云层时间序列生成中的应用。这些工作不仅拓展了视频预测技术在气象领域的边界,还促进了光学流方法与传统机器学习模型的融合,为后续研究提供了可复现的基准和评估框架。
以上内容由遇见数据集搜集并总结生成



