five

synthetic dataset for cloud optical thickness estimation

收藏
github2024-05-21 更新2024-05-31 收录
下载链接:
https://github.com/aleksispi/ml-cloud-opt-thick
下载链接
链接失效反馈
官方服务:
资源简介:
用于云光学厚度估计的合成数据集,可用于云检测,具体细节可参考相关论文。

A synthetic dataset for cloud optical thickness estimation, which can be used for cloud detection. For specific details, please refer to the relevant papers.
创建时间:
2023-11-09
原始信息汇总

数据集概述

数据集介绍

本项目引入了两个创新的数据集:

  1. 合成云光学厚度估计数据集:用于云光学厚度估计的合成数据集,可从此处下载。
  2. 真实卫星图像数据集:包含标记为clear或cloudy的真实卫星图像,可从此处下载。

数据集使用

  • 合成云光学厚度数据集:用于训练和评估机器学习模型,主要文件包括cot_synth_train.pycot_synth_eval.py
  • 真实卫星图像数据集:用于评估模型在瑞典森林机构(SFA)的云/清晰图像二分类设置中的表现,主要文件为swe_forest_agency_cls.py

预训练模型

预训练模型权重已提供,可用于合成云光学厚度数据集和真实卫星图像数据集的评估。

  • 合成云光学厚度数据集:预训练模型可从此处下载。
  • 真实卫星图像数据集:预训练模型可从此处下载。

引用信息

如需引用本数据集及相关研究,请使用以下引用格式:

@article{pirinen2024creating, title={Creating and Leveraging a Synthetic Dataset of Cloud Optical Thickness Measures for Cloud Detection in MSI}, author={Pirinen, Aleksis and Abid, Nosheen and Paszkowsky, Nuria Agues and Timoudas, Thomas Ohlson and Scheirer, Ronald and Ceccobello, Chiara and Kov{a}cs, Gy{"o}rgy and Persson, Anders}, journal={Remote Sensing}, volume={16}, number={4}, pages={694}, year={2024}, publisher={MDPI} }

搜集汇总
数据集介绍
main_image_url
构建方式
在构建云光学厚度估算合成数据集的过程中,研究团队采用了先进的模拟技术,通过精心设计的算法生成了一系列具有代表性的云层图像。这些图像不仅涵盖了多种云层类型,还模拟了不同光学厚度条件下的云层特征。数据集的构建严格遵循科学实验的标准,确保每一张图像都能准确反映实际大气中的云层特性。此外,数据集还包含了详细的元数据,记录了每张图像的生成参数和模拟条件,为后续的研究和应用提供了坚实的基础。
特点
该合成数据集的显著特点在于其高度逼真的云层模拟和多样化的光学厚度覆盖。通过模拟不同大气条件和云层类型,数据集能够提供丰富的训练样本,有助于提升云检测和光学厚度估算模型的性能。此外,数据集的结构设计合理,便于研究人员进行数据分割和模型训练。其高精度的模拟结果和详尽的元数据记录,使得该数据集在云层研究和气象预测领域具有广泛的应用前景。
使用方法
使用该合成数据集进行云光学厚度估算模型的训练和评估,首先需要下载数据集并解压缩。随后,用户应根据提供的代码库设置Conda环境,并运行`cot_synth_train.py`进行模型训练,训练过程中模型权重将自动保存。训练完成后,可通过`cot_synth_eval.py`对模型进行评估,评估结果将显示在控制台。此外,数据集还支持多模型集成评估,用户可通过调整相关参数实现。预训练模型权重也可供下载使用,进一步简化了模型评估的流程。
背景与挑战
背景概述
在遥感领域,云的光学厚度(Cloud Optical Thickness, COT)估计是一个关键问题,直接影响气候模型和天气预报的准确性。为了解决这一问题,Aleksis Pirinen等人于2024年创建了一个合成数据集,专门用于云的光学厚度估计。该数据集不仅在Remote Sensing期刊上发表,还在ICLR 2024的ML-for-RS研讨会上进行了口头报告,并在EUMETSAT 2023上以海报形式展示。该数据集的创建旨在通过合成数据提高云检测的准确性,并已成功应用于实际卫星图像的云检测任务中。
当前挑战
该数据集在构建过程中面临多个挑战。首先,合成数据的生成需要精确的物理模型和大量的计算资源,以确保数据的真实性和多样性。其次,数据集的标注过程复杂,需要专业知识来区分清晰和多云的图像。此外,数据集的应用场景广泛,从气候研究到森林管理,要求模型在不同环境下均能保持高精度。最后,数据集的更新和维护也是一个持续的挑战,以应对不断变化的云层特性和新的遥感技术。
常用场景
经典使用场景
在遥感领域,合成云光学厚度估算数据集被广泛用于训练和评估机器学习模型,以实现对多光谱图像(MSI)中云层的精确检测。该数据集通过模拟不同光学厚度的云层,为研究人员提供了一个理想的环境,用于开发和验证云检测算法。经典的使用场景包括使用合成数据训练深度学习模型,如多层感知器(MLP)和卷积神经网络(CNN),以提高云检测的准确性和鲁棒性。
衍生相关工作
基于该数据集,研究人员开发了多种云检测和分类模型,包括多层感知器(MLP)、卷积神经网络(CNN)和全卷积网络(FCN)。这些模型不仅在学术界引起了广泛关注,还被应用于实际的卫星数据处理和森林监测中。此外,该数据集还促进了相关领域的研究,如云层光学特性的进一步分析和建模,以及多光谱图像处理技术的改进。
数据集最近研究
最新研究方向
在遥感领域,合成云光学厚度数据集的最新研究方向主要集中在利用深度学习模型进行云检测和光学厚度估计。该数据集不仅在学术界引起了广泛关注,还在2024年6月的国际会议ICLR和EUMETSAT上进行了展示,进一步推动了其在实际应用中的发展。特别值得一提的是,2024年6月,基于该数据集开发的云光学厚度模型已成功发射至太空,与Unibap和D-orbit的合作标志着其在空间技术中的重要应用。这一进展不仅提升了云检测的准确性,还为未来的气象预测和环境监测提供了新的技术支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作