five

95-Cloud

收藏
github2024-05-05 更新2024-05-31 收录
下载链接:
https://github.com/SorourMo/95-Cloud-An-Extension-to-38-Cloud-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
95-Cloud是一个扩展自38-Cloud的数据集,用于卫星图像中的云二值分割。它包含34,701个384*384大小的训练补丁,这些补丁来自75个Landsat 8 Collection 1 Level-1场景,主要位于北美。测试集与38-Cloud相同,包含9201个补丁。数据集的每个补丁有4个相应的光谱通道:红、绿、蓝和近红外。

The 95-Cloud dataset, an extension of the 38-Cloud dataset, is designed for binary segmentation of clouds in satellite imagery. It comprises 34,701 training patches, each sized 384*384, derived from 75 Landsat 8 Collection 1 Level-1 scenes predominantly located in North America. The test set remains identical to that of 38-Cloud, consisting of 9,201 patches. Each patch in the dataset is associated with four corresponding spectral channels: red, green, blue, and near-infrared.
创建时间:
2019-09-18
原始信息汇总

数据集概述

数据集名称

  • 95-Cloud

数据集描述

  • 95-Cloud 是一个云检测数据集的扩展,基于先前发布的 38-Cloud 数据集。

数据集内容

  • 训练集:包含34,701个384*384像素的补丁,主要提取自北美地区的75个Landsat 8 Collection 1 Level-1场景。
  • 测试集:与38-Cloud的测试集完全相同,包含9201个补丁,来自20个场景。

数据集特点

  • 训练集比38-Cloud多57个场景。
  • 每个补丁包含4个对应的谱通道:红(band 4)、绿(band 3)、蓝(band 2)和近红外(band 5),这些通道分别存储在对应的目录中。
  • 数据集目录结构与38-Cloud相同。

数据集下载与使用

  • 数据集分为两部分下载:
    • 57个场景的95-Cloud训练集。
    • 剩余的训练场景(38个场景)和20个测试场景。
  • 下载后需合并数据。

数据集注意事项

  • 薄云和雾被视为云(与厚云相同)。
  • 自然彩色图像是用于进一步可视化的伪彩色图像,未用于训练和测试。
  • 提供了一个包含21502个有信息补丁(黑边小于80%)的CSV文件。

数据集引用

  • 若使用此数据集,请引用相关论文。
搜集汇总
数据集介绍
main_image_url
构建方式
95-Cloud数据集作为38-Cloud数据集的扩展,其构建基于75个Landsat 8 Collection 1 Level-1场景,主要覆盖北美地区。训练集包含34,701个384*384大小的图像块,而测试集则与38-Cloud数据集完全一致,包含9,201个图像块。每个图像块包含四个光谱通道,分别是红、绿、蓝和近红外波段,这些通道分别存储在对应的目录中。数据集因空间限制被分为两部分,用户需下载后合并使用。
使用方法
使用95-Cloud数据集时,用户需先下载并合并数据集的两部分。数据集的目录结构与38-Cloud保持一致,便于用户快速上手。每个图像块包含四个独立的光谱通道,用户可根据需求进行组合或单独使用。此外,数据集中提供的CSV文件列出了所有有效的训练图像块,用户可据此筛选数据,避免无效信息的影响。数据集适用于云检测算法的训练与评估,尤其适合基于卷积神经网络的研究。
背景与挑战
背景概述
95-Cloud数据集,作为38-Cloud数据集的扩展,由Mohajerani和Saeedi等人于2020年提出,旨在进一步提升卫星图像中云检测的精度。该数据集包含34,701个384*384像素的训练图像块,这些图像块从75个Landsat 8 Collection 1 Level-1场景中提取,主要覆盖北美地区。95-Cloud的测试集与38-Cloud完全相同,包含9,201个图像块。与38-Cloud相比,95-Cloud的训练集增加了57个场景,进一步丰富了数据多样性。该数据集的提出不仅为云检测算法提供了更为丰富的训练数据,还推动了遥感图像处理领域的发展,尤其是在云检测和分割任务中。
当前挑战
95-Cloud数据集在构建过程中面临多项挑战。首先,由于Landsat 8图像的黑边问题,部分图像块包含大量无用信息,需通过筛选去除。其次,数据集中的薄云和雾被视为云,增加了分类的复杂性。此外,数据集的规模较大,导致存储和处理上的困难,需将其分为多个部分进行下载和合并。在应用层面,如何有效利用多光谱通道信息进行云检测,以及如何在复杂背景下准确区分云与非云区域,仍是该数据集面临的主要挑战。
常用场景
经典使用场景
95-Cloud数据集在遥感图像处理领域中,主要用于云检测与分割任务。其经典使用场景包括利用深度学习模型,如卷积神经网络(CNN),对Landsat 8卫星图像进行云层识别与分割。通过训练模型,可以自动识别图像中的云层区域,从而提高遥感图像的分析效率和准确性。
解决学术问题
95-Cloud数据集解决了遥感图像中云层检测的学术难题,特别是在复杂气象条件下,如何准确识别和分割云层。该数据集通过提供大量高质量的训练样本,帮助研究者开发和验证云检测算法,推动了遥感图像处理技术的发展,具有重要的学术价值和实际意义。
实际应用
在实际应用中,95-Cloud数据集被广泛用于气象预报、环境监测和农业管理等领域。例如,通过精确的云层检测,可以提高气象预报的准确性;在环境监测中,云层数据有助于分析大气污染和气候变化;在农业管理中,云层信息可以辅助精准农业,优化作物种植和灌溉策略。
数据集最近研究
最新研究方向
在遥感领域,云检测技术一直是研究的热点之一,尤其是在卫星图像处理中。95-Cloud数据集作为38-Cloud的扩展,进一步丰富了云检测任务的训练数据,推动了基于深度学习的云分割算法的发展。最新的研究方向主要集中在优化云检测模型的性能,如通过引入更复杂的损失函数(如Filtered Jaccard Loss)来提升模型的精度。此外,研究者们也在探索如何更有效地处理薄云和雾霾等复杂云层,以及如何利用多光谱信息进行更精细的云层分割。这些研究不仅提升了卫星图像的分析能力,也为气候变化监测、农业估产等领域提供了更为可靠的数据支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作