five

reBEN

收藏
arXiv2024-07-04 更新2024-06-21 收录
下载链接:
https://bigearth.net
下载链接
链接失效反馈
官方服务:
资源简介:
reBEN数据集是由柏林学习和数据基础研究所与柏林工业大学联合创建的大规模多模态遥感图像数据集,包含549,488对Sentinel-1和Sentinel-2图像块。数据集通过最新的sen2cor工具进行大气校正,提高了图像质量,并引入了新的地理分割算法,减少了训练、验证和测试集之间的空间相关性。reBEN数据集适用于像素级和场景级的学习任务,旨在解决遥感图像分类和检索问题,提高深度学习模型在遥感领域的应用效果。

The reBEN dataset is a large-scale multimodal remote sensing image dataset jointly developed by the Berlin Institute for Learning and Data Fundamentals and the Technische Universität Berlin. It contains 549,488 pairs of Sentinel-1 and Sentinel-2 image patches. The dataset uses the state-of-the-art sen2cor tool for atmospheric correction to improve image quality, and introduces a novel geographic segmentation algorithm to reduce spatial correlation among the training, validation and test sets. The reBEN dataset is suitable for pixel-level and scene-level learning tasks, aiming to address remote sensing image classification and retrieval problems and enhance the application performance of deep learning models in the remote sensing domain.
提供机构:
柏林学习和数据基础研究所 (BIFOLD) 和柏林工业大学
创建时间:
2024-07-04
搜集汇总
数据集介绍
main_image_url
构建方式
为了支持遥感图像分析的深度学习研究,reBEN数据集应运而生。该数据集由549,488对Sentinel-1和Sentinel-2图像块组成,这些图像块最初来源于BigEarthNet数据集,随后被分割成1200米x 1200米的块。Sentinel-2图像块经过大气校正,使用sen2cor工具的最新版本进行处理,从而获得了比BigEarthNet中存在的图像块更高质量的结果。每个图像块都与一个像素级参考图和场景级多标签相关联,这使得reBEN适合于像素级和场景级的学习任务。标签来源于2018年最新的CORINE Land Cover(CLC)图,利用19类的命名法,正如BigEarthNet中所使用的那样。使用最新的CLC图克服了BigEarthNet中存在的标签噪声问题。
特点
reBEN数据集的特点在于其高质量、多模态和多标签的特性。它不仅提供了Sentinel-1和Sentinel-2图像块,而且还提供了像素级参考图和场景级多标签,这对于像素级和场景级的学习任务非常有用。此外,reBEN数据集还引入了一种新的基于地理的分割分配算法,该算法可以显著降低训练集、验证集和测试集之间的空间相关性,从而提高了深度学习模型评估的可靠性。此外,reBEN数据集还提供了一些软件工具,可以将数据集转换为深度学习优化的数据格式,从而减少了深度学习模型的训练时间。
使用方法
使用reBEN数据集时,首先需要下载并处理Sentinel-1和Sentinel-2图像块,然后使用sen2cor工具进行大气校正。接下来,将图像块分割成1200米x 1200米的块,并将每个块与像素级参考图和场景级多标签相关联。然后,可以使用提供的软件工具将数据集转换为深度学习优化的数据格式。最后,可以使用各种深度学习模型在reBEN数据集上进行训练和评估。
背景与挑战
背景概述
遥感图像分析领域正经历着技术的飞速发展,随着卫星系统的不断进步,遥感图像数据档案也在迅速增长。为了准确分析这些庞大的数据,自动化方法的研究变得尤为重要。深度学习(DL)在遥感社区中的应用日益增长,并成为研究的热点。为了支持这些方法的发展和评估,已经提出了几个大规模的基准数据集。其中,BigEarthNet是一个广泛使用的多模态和多标签基准数据集,它由Sentinel-1和Sentinel-2图像块组成,覆盖了10个欧洲国家。然而,BigEarthNet数据集存在一些问题,例如大气校正工具的更新、土地利用土地覆盖(LULC)标签噪声、训练、验证和测试分割的相关性以及缺乏高效的DL模型训练软件工具。为了解决这些问题,Kai Norman Clasen等人提出了reBEN数据集,这是一个经过改进的大规模、多模态遥感数据集,旨在支持DL在遥感图像分析中的应用。
当前挑战
reBEN数据集面临的主要挑战包括:1) 大气校正工具的更新,导致先前使用旧版本工具处理的图像可能不符合最新标准;2) LULC标签噪声,影响了DL模型的训练和评估;3) 训练、验证和测试分割之间的空间相关性高,难以进行可靠的评价;4) 缺乏有效的软件工具来支持高效的DL模型训练;5) 缺少基于最新技术的预训练模型。reBEN数据集通过使用最新的大气校正工具、最新的CLC地图、新的地理分割算法、优化的数据格式转换工具以及最新的预训练模型来应对这些挑战,从而提高遥感图像分析的可靠性和可解释性。
常用场景
经典使用场景
reBEN数据集是一个大规模的多模态遥感图像分析数据集,它通过提供Sentinel-1和Sentinel-2图像对的像素级参考图和场景级多标签,支持像素级和场景级的学习任务。这使得reBEN数据集在多模态多标签图像分类问题中具有经典的使用场景,例如,可以使用它来训练和评估深度学习模型,以便于对遥感图像进行分类、检索和场景理解。
解决学术问题
reBEN数据集解决了BigEarthNet数据集中存在的一些问题,包括使用较旧版本的大气校正工具sen2cor导致的数据质量问题、土地使用和土地覆盖标签噪声问题、训练、验证和测试集之间的空间相关性问题、缺乏软件工具以高效地进行深度学习模型训练,以及缺乏最新的预训练模型。reBEN数据集通过使用最新版本的大气校正工具、使用最新的CORINE Land Cover地图来生成标签、提出新的地理分割分配算法来减少数据集之间的空间相关性、提供数据格式转换工具以优化深度学习模型的训练,以及发布使用最新深度学习模型预训练的权重,从而解决了这些问题。
衍生相关工作
reBEN数据集的发布推动了遥感图像分析领域的研究进展。例如,基于reBEN数据集,研究人员可以开发更先进的深度学习模型,用于解决遥感图像分析中的各种问题。此外,reBEN数据集还可以用于开发新的遥感图像分析算法和工具,例如,可以使用reBEN数据集来开发用于土地覆盖分类、城市规划和环境监测等任务的算法和工具。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作