Himawari-8 AHI-CC Fusion Patch
收藏arXiv2025-09-19 更新2025-09-23 收录
下载链接:
https://www.eorc.jaxa.jp/ptree/userguide.html, http://www.cloudsat.cira.colostate.edu/data-Productsatlevel2b
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由日本气象卫星Himawari-8提供的AHI多光谱图像数据和CALIPSO/CPR垂直剖面数据融合而成,用于构建时空匹配的AHI-CC数据集。数据集包含高时空分辨率的可见光和热红外图像,以及空间borne激光雷达和雷达数据,以获取详细的3D云相结构。该数据集旨在解决云相结构重建的问题,为数值天气预报和气候变化研究提供更精确的模型参数化。
This dataset is fused from AHI multispectral image data provided by Japan's Himawari-8 meteorological satellite and CALIPSO/CPR vertical profile data, for constructing the spatiotemporally matched AHI-CC dataset. It contains high-spatiotemporal-resolution visible and thermal infrared images, as well as spaceborne lidar and radar data, to obtain detailed 3D cloud phase structures. This dataset aims to address the problem of cloud phase structure reconstruction, providing more accurate model parameterization for numerical weather prediction and climate change research.
提供机构:
中国气象局地球系统数值模拟与预测中心 (CEMC), 中国科学院航空航天信息研究院, 香港科技大学 (广州), 四川大学工程技术学院计算机科学与工程学院, 广州大学电子与通信工程学院, 中国科学院大气物理研究所
创建时间:
2025-09-19
搜集汇总
数据集介绍

构建方式
在气象遥感领域,Himawari-8 AHI-CC Fusion Patch数据集的构建采用了多源卫星观测数据的时空融合技术。该数据集通过精确匹配日本葵花8号静止卫星的AHI多光谱成像仪数据与CALIOP-CPR主动探测器的垂直剖面数据,实现了被动光学观测与主动雷达探测的优势互补。构建过程中首先确定2018年10月至12月的观测时段,覆盖东经100°至160°、南纬60°至北纬60°的广阔区域。利用AHI的16个光谱通道数据,结合卫星天顶角、太阳天顶角及地理坐标等辅助变量,与CloudSat/CALIPSO提供的2B-CLDCLASS-LIDAR云相态标注进行对齐。通过设置±5分钟的时间窗口和空间最近邻匹配原则,将LIDAR扫描点与AHI像素建立对应关系,最终生成包含反射率、亮温和云相态垂直分布特征的128×128像素样本块。
特点
该数据集的核心特征体现在其多模态融合的云相态三维结构表征能力。数据集整合了高时空分辨率的可见光与热红外波段影像,以及具备垂直探测精度的激光雷达和云雷达剖面数据,形成了独特的图像-剖面配对样本。每个样本包含从地表至19公里高度的38个垂直分层,以500米分辨率精确标注无云、冰云、混合相态云和水云四种云相态类别。数据统计显示,云相态分布呈现显著的不均衡特性,其中无云区域占比达89.3%,冰云、水云和混合云分别占5.7%、1.2%和3.9%。这种结构设计既保留了云层垂直结构的细节信息,又通过多光谱特征与三维标注的对应关系,为深度学习模型提供了丰富的空间-光谱联合特征学习基础。
使用方法
该数据集主要用于监督学习框架下的三维云相态结构重建任务。在使用过程中,研究者可将16通道的AHI多光谱图像作为模型输入,对应的CALIOP-CPR垂直剖面数据作为真值标签,构建从二维遥感观测到三维云结构的映射关系。数据集已按8:1:1的比例划分为训练集、验证集和测试集,支持端到端的深度学习模型训练。典型应用流程包括:首先对多光谱数据进行归一化处理,结合地理坐标和角度参数构建输入特征张量;然后采用卷积神经网络或Transformer等架构提取空间特征;最后通过三维卷积层和Softmax分类器输出每个体素的云相态概率分布。评估时需采用加权准确率、Kappa系数等指标应对类别不均衡问题,重点关注模型对少数云类的识别能力及垂直边界重建精度。
背景与挑战
背景概述
Himawari-8 AHI-CC Fusion Patch数据集于2025年由四川轻化工大学、中国气象局地球系统数值预报中心等机构联合构建,旨在通过融合地球静止卫星的多光谱成像数据与极轨卫星的主动探测剖面,解决三维云相态结构重建这一大气遥感核心问题。该数据集整合了Himawari-8卫星的16个高时空分辨率光谱通道与CALIOP/CPR的垂直云相态标注,覆盖2018年10月至12月东亚至太平洋区域,为数值天气预报中的云微物理参数化提供了关键数据支撑。其创新性在于首次实现了被动光学观测与主动剖面数据的时空匹配,推动了深度学习在云垂直结构反演中的应用。
当前挑战
该数据集面临的领域挑战在于地球静止卫星仅能提供二维辐射数据,缺乏直接垂直结构信息,而CloudSat/CALIPSO等主动探测数据受轨道稀疏性限制,导致标注样本空间分布不均。构建过程中的技术挑战包括多源卫星数据的时空配准精度控制、不同传感器分辨率差异引起的特征融合偏差,以及冰云、水云等少数类样本在三维体素标注中的不平衡问题。此外,云相态在垂直方向上的过渡区域(如混合相态云边界)的精细标注对模型区分相似辐射特征的能力提出了更高要求。
常用场景
经典使用场景
在气象遥感领域,Himawari-8 AHI-CC Fusion Patch数据集通过融合地球静止卫星的多光谱成像数据与主动传感器的垂直廓线,为三维云相结构重建提供了标准化基准。该数据集最经典的应用场景在于训练深度学习模型从二维多通道卫星影像中反演云层的垂直分布,尤其适用于解析多层云系和混合相态云的复杂空间配置。其时空匹配的样本对支持模型学习可见光、热红外波段与云冰、云水相态之间的非线性映射关系,为数值天气预报中的云微物理参数化提供关键输入。
解决学术问题
该数据集有效解决了传统遥感观测中垂直结构信息缺失的学术难题,将被动光学传感器的广覆盖优势与主动雷达的垂直探测能力相结合。通过提供体素级云相标签,它支持对云层相态过渡区、多层云叠加结构等复杂气象现象的量化研究,显著提升了云相分类任务在边界层和深对流云系中的精度。这一突破性工作为气候模型中辐射传输过程的精确模拟奠定了数据基础,推动了多模态卫星数据融合在大气科学中的方法论创新。
衍生相关工作
该数据集的发布催生了系列创新性研究,如基于CGAN的MODIS垂直反射率反演框架、融合物理约束的CloudMask损失函数设计,以及采用自监督学习的三维云场重建方法。CLANN模型通过神经网络实现了地球静止卫星数据的直接三维云量估计,而IceCloudNet则专注于高分辨率云冰含量的反演。这些衍生工作共同推动了注意力机制、状态空间模型等先进深度学习架构在气象遥感领域的适配与优化,形成了多尺度、多模态的云物理参数反演技术体系。
以上内容由遇见数据集搜集并总结生成



