TJNU multimodal ground-based cloud database (MGCD)
收藏github2024-10-30 更新2024-11-28 收录
下载链接:
https://github.com/shuangliutjnu/Multimodal-Ground-based-Cloud-Database
下载链接
链接失效反馈官方服务:
资源简介:
TJNU多模态地面云数据库(MGCD)是在中国天津收集的,时间从2017年到2018年。它包含8000个多模态地面样本。根据世界气象组织(WMO)发布的国际云分类系统标准以及实践中云的视觉相似性,天空条件被分为七种类型:1) 积云,2) 高积云和卷积云,3) 卷云和卷层云,4) 晴空,5) 层积云、层云和高层云,6) 积雨云和雨层云,7) 混合云。此外,云量不超过10%的云图像被归类为晴空。MGCD由来自七个类别的4000个训练样本和4000个测试样本组成,每个样本包含一张地面云图像和一组多模态云信息,这些信息是一一对应的。云图像由带有鱼眼镜头的天空相机拍摄,并以JPEG格式存储,像素分辨率为1024×1024。多模态云信息由气象站收集,包括温度、湿度、压力和风速,并以四个元素的向量形式存储。所有样本均由气象学家和地面云研究人员共同标注。MGCD将免费提供给云相关研究人员,以促进研究。
TJNU Multimodal Ground-based Cloud Database (MGCD) was collected in Tianjin, China, from 2017 to 2018. It contains 8000 multimodal ground-based samples. Based on the International Cloud Classification System standards issued by the World Meteorological Organization (WMO) and the visual similarity of clouds in practical scenarios, sky conditions are categorized into seven types: 1) Cumulus, 2) Altocumulus and Cirrocumulus, 3) Cirrus and Cirrostratus, 4) Clear sky, 5) Stratocumulus, Stratus and Altostratus, 6) Cumulonimbus and Nimbostratus, 7) Mixed clouds. Additionally, cloud images with cloud coverage not exceeding 10% are classified as clear sky. MGCD comprises 4000 training samples and 4000 test samples across the seven categories, with each sample containing one ground-based cloud image and a set of paired multimodal cloud information. The cloud images are captured by a sky camera equipped with a fisheye lens, stored in JPEG format with a resolution of 1024×1024 pixels. The multimodal cloud information is collected by meteorological stations, including temperature, humidity, atmospheric pressure and wind speed, and stored as a four-element vector. All samples were jointly annotated by meteorologists and ground cloud researchers. MGCD will be freely available to researchers working on cloud-related studies to facilitate relevant academic research.
创建时间:
2024-10-30
原始信息汇总
Multimodal-Ground-based-Cloud-Database
数据集概述
- 名称: TJNU multimodal ground-based cloud database (MGCD)
- 收集地点: 中国天津
- 收集时间: 2017年至2018年
- 样本数量: 8000个多模态地面样本
- 样本分类: 根据国际云分类系统标准和实际视觉相似性,将天空条件分为七种类型:
- 积云
- 高积云和卷积云
- 卷云和卷层云
- 晴空
- 层积云、层云和高积云
- 积雨云和雨层云
- 混合云
- 样本组成: 每个样本包含一张地面云图像和一组多模态云信息,两者一一对应。
数据详情
- 图像:
- 采集设备: 鱼眼镜头的天空相机
- 格式: JPEG
- 分辨率: 1024×1024像素
- 多模态云信息:
- 采集设备: 气象站
- 信息类型: 温度、湿度、压力和风速
- 存储格式: 四元素向量
数据集结构
- 训练样本: 4000个
- 测试样本: 4000个
- 标注: 由气象学家和地面云研究人员共同标注
使用许可
- 免费提供: 供云相关研究人员使用,以促进研究
- 下载前要求: 需阅读并理解MGCD Agreement,下载和使用数据集即表示同意所有限制和要求。
引用
- 参考文献:
- Liu, S., Li, M., Zhang, Z., Cao, X., & Durrani, T. S. (2020). Ground-Based Cloud Classification Using Task-Based Graph Convolutional Network. Geophysical Research Letters, 47(5), e2020GL087338.
- Liu, S., Li, M., Zhang, Z., Xiao, B., & Durrani, T. S. (2020). Multi-evidence and Multi-modal Fusion Network for Ground-based Cloud Recognition. Remote Sensing, 12(3), 464.
搜集汇总
数据集介绍

构建方式
在天津地区,从2017年至2018年,通过结合国际云分类系统标准与实际视觉相似性,构建了TJNU多模态地面云数据库(MGCD)。该数据库包含8000个多模态地面样本,涵盖七种天空类型:积云、高积云与卷积云、卷云与卷层云、晴空、层积云、层云与高积云、积雨云与雨层云以及混合云。每个样本由一张地面云图像和一组多模态云信息组成,图像由鱼眼镜头的天空相机捕捉,分辨率为1024×1024像素,并以JPEG格式存储。多模态云信息包括温度、湿度、压力和风速,存储为四元素向量。所有样本均由气象学家和地面云研究人员共同标注。
特点
MGCD的显著特点在于其多模态数据的融合,不仅包含高分辨率的地面云图像,还结合了气象站收集的多模态云信息,如温度、湿度、压力和风速。这种多模态数据的结合,为云的分类和识别提供了丰富的信息基础。此外,数据集的样本数量充足,分为4000个训练样本和4000个测试样本,确保了数据集的广泛适用性和可靠性。
使用方法
使用MGCD时,研究者需先阅读并同意MGCD协议,然后通过提供的链接下载数据集。数据集的使用应遵循协议中的所有限制和要求。研究者可以利用该数据集进行云分类、识别及多模态数据融合的研究。在使用过程中,建议引用相关文献以确保学术诚信。数据集的结构清晰,图像与多模态信息一一对应,便于研究者进行数据分析和模型训练。
背景与挑战
背景概述
TJNU多模态地面云数据库(MGCD)是由中国天津的天津师范大学在2017年至2018年间收集的,旨在为云相关研究提供一个全面的多模态数据集。该数据集包含了8000个多模态地面样本,根据世界气象组织(WMO)发布的国际云分类系统标准以及实际云的视觉相似性,将天空条件分为七种类型。每个样本包括一张地面云图像和一组多模态云信息,这些信息通过气象站收集,包括温度、湿度、压力和风速。所有样本均由气象学家和地面云研究人员共同标注,旨在促进云研究领域的发展。
当前挑战
MGCD数据集在构建过程中面临多项挑战。首先,云的分类需要依据复杂的气象标准和视觉相似性,这要求高精度的标注工作。其次,多模态信息的整合与对应关系的确立,增加了数据处理的复杂性。此外,数据集的规模和多样性要求高效的存储和检索机制。最后,确保数据集的免费开放使用,同时保护数据隐私和知识产权,也是一项重要的挑战。
常用场景
经典使用场景
在气象学领域,TJNU多模态地面云数据库(MGCD)的经典使用场景主要集中在云分类和气象预测模型的训练与验证。该数据集通过结合地面云图像与多模态云信息,如温度、湿度、压力和风速,为研究人员提供了一个丰富的数据资源。通过这些数据,研究人员可以开发和优化云分类算法,从而提高对不同类型云的识别精度。此外,该数据集还可用于训练气象预测模型,以提高对未来天气状况的预测准确性。
解决学术问题
TJNU多模态地面云数据库(MGCD)解决了气象学领域中云分类和气象预测的关键学术问题。传统的云分类方法依赖于单一的图像信息,而MGCD通过引入多模态数据,显著提升了分类的准确性和可靠性。此外,该数据集为气象预测模型提供了更为全面的数据支持,有助于提高预测模型的性能和稳定性。其意义在于推动了气象学研究的进步,为更精确的天气预报和气候研究奠定了基础。
衍生相关工作
TJNU多模态地面云数据库(MGCD)的发布催生了一系列相关研究工作。例如,Liu等人在2020年发表的论文《基于任务的图卷积网络的地面云分类》,利用该数据集开发了一种新的云分类方法,显著提高了分类精度。同年,Liu等人还提出了《多证据和多模态融合网络用于地面云识别》,进一步探索了多模态数据在云识别中的应用。这些研究不仅推动了气象学的发展,也为其他领域的多模态数据处理提供了新的思路和方法。
以上内容由遇见数据集搜集并总结生成



