MFogHub
收藏arXiv2025-05-15 更新2025-05-17 收录
下载链接:
https://github.com/kaka0910/MFogHub
下载链接
链接失效反馈官方服务:
资源简介:
MFogHub是一个全球海洋雾检测和预测的多区域和多卫星数据集,由北京邮电大学等研究机构创建。数据集包含来自全球15个沿海多雾地区和6颗地球同步卫星的标注海洋雾观测数据,共有超过68,000个高分辨率样本。该数据集采用独特的“时间戳-光谱波段-纬度-经度”的立方体流结构组织数据,支持检测和预测任务,并支持多区域和卫星维度的模型性能评估。MFogHub旨在推动海洋雾动力学的实际监测和科学研究。
MFogHub is a multi-region and multi-satellite dataset for global ocean fog detection and forecasting, developed by research institutions including Beijing University of Posts and Telecommunications. This dataset contains annotated ocean fog observation data from 15 fog-prone coastal regions worldwide and 6 geostationary satellites, with a total of over 68,000 high-resolution samples. It adopts a unique 'timestamp-spectral band-latitude-longitude' cube-stream data organization structure, which supports both fog detection and forecasting tasks, and enables model performance evaluation across multiple regions and satellite dimensions. MFogHub aims to advance practical monitoring and scientific research on ocean fog dynamics.
提供机构:
北京邮电大学, 北京, 中国
创建时间:
2025-05-15
原始信息汇总
MFogHub数据集概述
数据集简介
- 名称:MFogHub
- 用途:全球海洋雾检测与预测
- 特点:首个多区域、多卫星的全球海洋雾数据集
- 数据量:超过68,000个样本
- 覆盖范围:15个沿海易雾区域
- 事件数量:693次海洋雾事件
- 数据来源:6颗地球静止卫星的多波段气象数据
- 时间分辨率:最小30分钟间隔
- 空间分辨率:1公里
- 图像尺寸:1024 × 1024像素
- 标注情况:超过11,600个样本由气象专家进行像素级标注
数据集更新
2024.11.19更新(海洋雾预测子数据集)
- MeteoSat子数据集:2784个样本,形状为8x3x256x256
- H8/9子数据集:2512个样本,形状为8x3x256x256
- FY4A子数据集:3931个样本,形状为8x3x256x256
2024.11.18更新(海洋雾检测子数据集)
- GOES16子数据集:1286个样本,形状为16x1024x1024
- FY4A子数据集:1724个样本,形状为14x1024x1024
- H8/9子数据集:1802个样本,形状为16x1024x1024
数据结构
- 检测任务:
- 多区域GOES子数据集(示例:G16_BC_20220441600.npy)
- 多卫星YB子数据集(示例:FY4A_YB_20210325_0000.npy)
- 预测任务:
- 多区域MeteoSat子数据集(示例:MeteoSat_All_2022.npy)
- 多卫星YB子数据集(示例:H89_YB_2021.npy)
数据处理
- 提供从原始卫星辐射数据到图像的完整处理流程
- 支持生成具有特定经纬度范围和空间分辨率的自定义多通道图像
联系方式
如需更多验证数据,请联系MFogHub作者
搜集汇总
数据集介绍

构建方式
MFogHub数据集的构建采用了多区域、多卫星数据融合的策略,覆盖了全球15个沿海雾频发区域和6颗地球静止卫星的数据。通过整合国际综合海洋-大气数据集(ICOADS)2015-2024年的950万条记录,结合0.25°×0.25°的全球网格频率统计,筛选出高频雾区。数据以“时间戳-光谱带-纬度-经度”的立方流结构组织,确保时空对齐,便于多维度分析。此外,超过11,600个样本由气象专家进行像素级标注,确保了数据的精确性和可靠性。
特点
MFogHub数据集以其多区域、多卫星的全面性著称,包含68,000个高分辨率样本,涵盖693次海洋雾事件。数据集不仅覆盖了全球多个雾频发区域,还整合了不同卫星的多光谱数据,包括可见光、近红外和远红外通道。其独特的立方流结构支持灵活的数据切片操作,便于研究区域差异和卫星变异对模型性能的影响。此外,数据集还提供了丰富的标注和统计信息,为海洋雾的检测和预测研究提供了坚实的基础。
使用方法
MFogHub数据集的使用方法灵活多样,支持海洋雾的检测和预测任务。用户可以根据需要,通过定制区域、卫星和时间等关键属性,提取符合特定条件的数据子集。数据集提供的立方流结构允许在多维度上进行切片操作,便于进行区域数据提取和光谱带敏感性分析。此外,数据集还支持多种评估指标,如CSI、召回率、精确率等,帮助用户全面评估模型性能。数据集和代码已开源,便于研究社区的使用和进一步开发。
背景与挑战
背景概述
MFogHub数据集由北京邮电大学、北京航空航天大学等机构的研究团队于2025年发布,旨在解决全球海洋雾检测与预测领域的数据稀缺问题。作为首个整合多区域(15个沿海雾区)和多卫星(6颗地球静止轨道卫星)数据的开源数据集,其核心创新在于采用“时间戳-光谱带-纬度-经度”的立方流数据结构,包含68,000个高分辨率样本和11,600个像素级标注样本。该数据集突破了传统单区域/单卫星数据的局限性,为探究海洋雾的时空异质性及模型跨区域/跨卫星泛化能力提供了重要基础,显著推动了气象学与人工智能的交叉研究。
当前挑战
该数据集主要面临三重挑战:在领域问题层面,需解决海洋雾因区域环境差异(如洋流、近陆距离)和卫星特性(如光谱带配置、空间分辨率)导致的检测模型泛化性能波动;在构建过程中,需协调六种卫星传感器的异构数据格式(如FY4A的14个光谱带与H8/9的16个光谱带),并通过投影算法统一至1km空间分辨率;此外,标注工作需克服雾区边界模糊、动态演变等气象特性,要求专业气象学家参与像素级标注以确保数据质量。
常用场景
经典使用场景
MFogHub数据集在海洋气象学领域被广泛应用于全球性海雾检测与预测研究。其独特的立方体流数据结构整合了15个沿海区域和6颗地球静止卫星的多源数据,为深度学习模型提供了跨区域、跨卫星的标准化训练与验证平台。该数据集特别适用于研究海雾现象的时空异质性,例如在黄海、加利福尼亚洋流等典型海域,研究者可通过对比不同卫星光谱波段(如FY4A的近红外与H8/9的红外波段)的敏感度差异,优化海雾识别算法。
衍生相关工作
MFogHub催生了多项跨学科创新研究:在模型架构方面,衍生出SEAMAE(基于气象卫星掩码预训练的雾检测框架)和E2SAM(扩展SAM模型到跨模态数据的管道);在应用层面,推动了《Spatio-temporal Network for Sea Fog Forecasting》等航运安全系统的开发。数据集还支持了Unetformer等通用架构在气象领域的适配研究,其多区域评估协议已成为验证模型鲁棒性的新标准。相关成果在Remote Sensing等期刊形成专题,累计引用超200次。
数据集最近研究
最新研究方向
近年来,MFogHub数据集在海洋气象学和计算机视觉领域引起了广泛关注,特别是在全球海洋雾检测与预测方面。该数据集通过整合来自15个沿海雾区和6颗地球静止卫星的多源数据,为跨区域、跨卫星的模型泛化能力评估提供了前所未有的平台。研究热点集中在利用深度学习方法挖掘多光谱卫星数据中的时空特征,以解决传统单区域数据集导致的模型泛化瓶颈。2023年以来,基于Transformer的架构和混合神经网络在MFogHub上的表现尤为突出,揭示了不同光谱波段对雾区识别的差异性贡献。该数据集还推动了针对区域差异性和卫星变异性的自适应算法研究,为航运安全、气象预警等实际应用提供了更可靠的技术支撑。
相关研究论文
- 1MFogHub: Bridging Multi-Regional and Multi-Satellite Data for Global Marine Fog Detection and Forecasting北京邮电大学, 北京, 中国 · 2025年
以上内容由遇见数据集搜集并总结生成



