five

M4Fog|海洋气象数据集|遥感数据分析数据集

收藏
arXiv2024-06-19 更新2024-08-06 收录
海洋气象
遥感数据分析
下载链接:
http://arxiv.org/abs/2406.13317v1
下载链接
链接失效反馈
资源简介:
M4Fog是一个全球多区域、多模态、多阶段的海洋雾检测和预报数据集,旨在连接海洋与大气。该数据集由北京邮电大学等机构创建,涵盖了2015至2024年间15个主要雾易发区域的数千次海洋雾事件。M4Fog整合了来自四系列地球静止气象卫星的遥感数据、气象观测和数值分析,构建了包含元素、纬度、经度和时间四个维度的'超级数据立方体'。数据集具有半小时的时间分辨率和1公里的空间分辨率,支持静态和动态海洋雾检测以及时空预测等多种应用,旨在提高海洋操作的气象服务质量和可靠性。
提供机构:
北京邮电大学
创建时间:
2024-06-19
AI搜集汇总
数据集介绍
main_image_url
构建方式
M4Fog数据集的构建基于多源气象数据的整合,包括来自四颗地球静止气象卫星的遥感数据、地面观测站数据以及数值分析数据。数据集涵盖了全球15个海洋雾频发区域,时间跨度为2015年至2024年。通过气象专家的像素级手动标注,数据集形成了68,000个“超级数据立方体”,每个立方体包含元素、纬度、经度和时间四个维度,时间分辨率为半小时,空间分辨率为1公里。数据集的构建旨在满足机器学习的多样性和连续性需求,同时反映真实世界的海洋雾气象服务场景。
使用方法
M4Fog数据集的使用方法主要包括三个任务轨道:静态海洋雾检测、动态海洋雾检测和遥感云图像的时空预测。静态海洋雾检测任务通过特定时刻的超级数据立方体识别海洋雾区域;动态海洋雾检测任务利用连续时间段的超级数据立方体进行海洋雾的动态识别;时空预测任务则通过连续的数据立方体序列预测未来的云图像变化。数据集提供了丰富的评估指标,如CSI、mIoU、Acc、TS和F1-score等,支持多种机器学习模型的训练和评估。
背景与挑战
背景概述
M4Fog数据集由北京邮电大学、中国国家气象中心、清华大学、北京航空航天大学和北京物资大学的研究团队于2024年提出,旨在解决全球海洋雾的检测与预测问题。海洋雾是一种复杂的低层大气现象,对全球航运构成重大威胁,可能导致严重的经济损失。尽管近年来机器学习方法在海洋雾检测方面表现出优于传统气象方法的准确性,但现有数据集多为私有或局限于单一区域,难以支持全球范围的海洋雾研究。M4Fog数据集整合了近十年的多模态数据,包括来自四颗地球静止气象卫星的遥感数据、气象观测数据和数值分析数据,覆盖了全球15个海洋雾频发区域。该数据集包含68,000个“超级数据立方体”,时间分辨率为半小时,空间分辨率为1公里,并通过气象专家的像素级标注,提供了迄今为止最全面的海洋雾检测与预测数据集。
当前挑战
M4Fog数据集面临的挑战主要包括两个方面:首先,海洋雾的检测与预测本身具有复杂性,海洋雾的形状多变且边界模糊,传统的遥感方法难以准确捕捉其动态变化。其次,数据集的构建过程中也面临诸多挑战,包括多源数据的整合与对齐、时间连续性的保证以及全球多区域数据的覆盖问题。此外,现有的公开数据集多为单一区域或单一数据源,缺乏多样性和连续性,难以支持全球范围的海洋雾研究。M4Fog通过整合多模态数据、设计多阶段和多区域的数据结构,有效应对了这些挑战,但仍需进一步补充夜间海洋雾数据,以支持全天候的海洋雾检测与预测。
常用场景
经典使用场景
M4Fog数据集主要用于海洋雾的检测与预测研究,尤其是在全球多个海域的复杂气象条件下。该数据集通过整合多模态数据,包括卫星遥感数据、地面观测站数据和数值分析数据,提供了从静态到动态的海洋雾检测任务,以及时空预测任务。研究人员可以利用该数据集开发机器学习模型,以提高海洋雾检测的准确性和预测的时效性。
解决学术问题
M4Fog数据集解决了海洋雾检测与预测领域中的多个关键学术问题。首先,它填补了现有数据集的空白,提供了全球多个海域的连续海洋雾事件数据,覆盖了从形成到消散的完整生命周期。其次,通过多模态数据的整合,该数据集能够更好地捕捉海洋雾的复杂特征,解决了单一数据源带来的局限性。最后,M4Fog数据集为机器学习模型提供了丰富的训练和测试数据,推动了海洋雾检测与预测技术的进步。
实际应用
M4Fog数据集在实际应用中具有广泛的价值。首先,它可以用于全球航运安全,帮助船舶和港口管理人员及时预测和应对海洋雾天气,减少经济损失。其次,该数据集可以支持气象服务部门提供更准确的海洋雾预警,提升沿海城市和港口的气象服务水平。此外,M4Fog还可以用于海洋生态研究,帮助科学家更好地理解海洋雾对海洋生态系统的影响。
数据集最近研究
最新研究方向
近年来,M4Fog数据集在海洋雾检测与预测领域的研究方向主要集中在多模态数据的融合与深度学习模型的优化上。通过结合卫星遥感数据、地面观测数据和数值分析数据,研究者们能够更全面地捕捉海洋雾的形成与消散过程。特别是,基于Transformer的模型在静态和动态海洋雾检测任务中表现出色,显著提升了检测的准确性和时效性。此外,时空预测任务也逐渐成为研究热点,研究者们利用连续的多阶段数据立方体,探索了云图像的时空变化规律,进一步推动了海洋雾预测技术的发展。这些研究不仅提高了海洋雾检测的精度,还为全球范围内的海洋气象服务提供了更可靠的技术支持。
相关研究论文
  • 1
    M4Fog: A Global Multi-Regional, Multi-Modal, and Multi-Stage Dataset for Marine Fog Detection and Forecasting to Bridge Ocean and Atmosphere北京邮电大学 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

GME Data

关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

CHFS中国家庭金融调查数据

  中国家庭金融调查(China Household Finance Survey, CHFS)是中国家庭金融调查与研究中心(以下简称“中心”)在全国范围内开展的抽样调查项目,旨在收集有关家庭金融微观层次的相关信息,主要内容包括:人口特征与就业、资产与负债、收入与消费、社会保障与保险以及主观态度等相关信息,对家庭经济、金融行为进行了全面细致刻画。  CHFS基线调查始于2011年,目前已分别在2011、2013、2015、2017和2019年成功实施五轮全国范围内的抽样调查项目,2021年第六轮调查还在进行中。CHFS最新公开的2019年第五轮调查数据,样本覆盖全国29个省(自治区、直辖市),343个区县,1360个村(居)委会,样本规模达34643户,数据具有全国及省级代表性。

CnOpenData 收录

Fruits-360

一个高质量的水果图像数据集,包含多种水果的图像,如苹果、香蕉、樱桃等,总计42345张图片,分为训练集和验证集,共有64个水果类别。

github 收录