RSI-CB
收藏arXiv2020-01-10 更新2024-06-21 收录
下载链接:
https://github.com/lehaifeng/RSI-CB
下载链接
链接失效反馈官方服务:
资源简介:
RSI-CB是一个基于众包数据构建的大规模遥感图像分类基准,由中南大学地球科学与信息物理学院的研究团队开发。该数据集包含两个子数据集,分别包含24000张和36000张图像,图像大小分别为256x256和128x128像素。数据集涵盖农业用地、建设用地及设施、交通运输及设施、水域及水利设施、林地和其他土地等六大类别,每个类别下有多个子类别。数据集的构建过程涉及从Open Street Map提取兴趣点,并结合高分辨率遥感图像进行标注。RSI-CB旨在为遥感图像处理提供一个全面的分类基准,支持深度学习模型的训练和评估,特别适用于解决大规模图像分类问题。
RSI-CB is a large-scale remote sensing image classification benchmark constructed from crowdsourced data, developed by the research team from the School of Geosciences and Info-Physics, Central South University. This dataset consists of two subsets, containing 24,000 and 36,000 images respectively, with image sizes of 256×256 and 128×128 pixels. The dataset covers six major categories: agricultural land, construction land and facilities, transportation infrastructure and facilities, water areas and water conservancy facilities, woodland, and other lands, with multiple sub-categories under each major category. The construction of the dataset involves extracting points of interest (POIs) from OpenStreetMap and performing annotation in combination with high-resolution remote sensing images. RSI-CB aims to provide a comprehensive classification benchmark for remote sensing image processing, supporting the training and evaluation of deep learning models, and is particularly suitable for solving large-scale image classification tasks.
提供机构:
中南大学地球科学与信息物理学院
创建时间:
2017-05-30
搜集汇总
数据集介绍

构建方式
RSI-CB数据集通过众包数据构建,利用Open Street Map (OSM)等众包数据源,结合高分辨率遥感图像进行标注。具体方法包括从OSM中提取兴趣点(POI),并根据地理坐标将其与从Bing Map和Google Earth下载的遥感图像对齐。数据集分为两个子集,分别为256×256像素和128×128像素,以适应不同深度卷积神经网络(DCNN)的需求。每个子集包含多个类别和子类别,涵盖农业用地、建设用地及设施、交通及设施、水域及水利设施、林地和其他用地等六大类。
特点
RSI-CB数据集具有以下特点:首先,它是一个全球范围的大规模遥感图像分类基准,涵盖多个国家和地区,确保了数据的多样性和广泛性。其次,数据集通过众包数据进行标注,减少了人工标注的成本和时间,同时保证了标注的准确性。此外,数据集的图像分辨率较高,范围从0.22米到3米,能够捕捉到更多的细节信息,适合复杂目标的分类任务。最后,数据集的类别体系基于中国土地利用分类标准,并结合了ImageNet的分层机制,确保了类别的多样性和全面性。
使用方法
RSI-CB数据集可用于多种遥感图像分类任务,包括深度学习模型的训练和评估。用户可以选择256×256或128×128像素的子集,根据不同的DCNN模型需求进行训练。数据集支持多种经典深度学习模型,如AlexNet、VGGNet、GoogLeNet和ResNet,并可用于手工特征(如SIFT、LBP等)的分类实验。此外,RSI-CB还支持模型迁移学习,用户可以利用该数据集训练的模型在其他遥感数据集(如UC-Merced)上进行测试,验证模型的泛化能力。
背景与挑战
背景概述
遥感图像分类是遥感图像处理中的基础任务,近年来,深度卷积神经网络(DCNN)在自然图像识别领域取得了突破性进展,主要得益于其强大的通用逼近能力、大规模数据集(如ImageNet)以及GPU提供的超级计算能力。然而,遥感领域仍然缺乏与ImageNet和Place2等相媲美的大规模基准数据集。为此,李海峰等人于2018年提出了基于众包数据的遥感图像分类基准(RSI-CB)。该数据集通过使用Open Street Map(OSM)等众包数据,有效地标注了遥感图像中的地面物体,构建了一个全球范围的大规模遥感图像分类基准。RSI-CB包含两个子数据集,分别为256×256和128×128像素大小,分别包含6个类别和35个子类别,共计超过24,000张图像,以及6个类别和45个子类别,共计超过36,000张图像。该数据集的分类体系参考了中国土地利用分类国家标准,并借鉴了ImageNet的分层机制,旨在为遥感图像分类任务提供一个更具代表性和多样性的基准。
当前挑战
RSI-CB数据集的构建面临多重挑战。首先,遥感图像中的物体种类繁多且复杂,传统的低分辨率数据集难以有效区分不同物体,而高分辨率数据集的构建则需要大量的标注工作。其次,遥感图像的全球覆盖性要求数据集具有广泛的地理分布,这增加了数据采集和标注的难度。此外,遥感图像受到相机视角、天气条件和太阳高度角等多种因素的影响,导致图像特征的多样性和复杂性增加。RSI-CB通过众包数据解决了部分标注问题,但众包数据的质量和密度分布不均,仍需人工筛选和校正,这增加了数据集构建的复杂性和时间成本。最后,如何确保数据集的多样性和代表性,使其能够适用于不同深度学习模型的训练,也是RSI-CB面临的重要挑战。
常用场景
经典使用场景
RSI-CB数据集的经典使用场景主要集中在遥感图像分类任务中。由于其大规模、多样化的标注数据,该数据集特别适用于深度卷积神经网络(DCNN)的训练与评估。通过使用RSI-CB,研究人员可以验证不同DCNN模型在遥感图像分类任务中的性能,尤其是在处理高分辨率遥感图像时,RSI-CB能够有效提升模型的分类精度。
实际应用
RSI-CB数据集在实际应用中具有广泛的前景,特别是在土地利用监测、城市规划、农业管理等领域。通过使用RSI-CB训练的模型,可以快速、准确地对遥感图像中的土地类型进行分类,帮助政府部门和相关机构更好地进行资源管理和环境监测。此外,RSI-CB的高分辨率特性使其在灾害评估、交通设施规划等应用中也具有重要价值。
衍生相关工作
RSI-CB数据集的提出激发了大量相关研究工作。首先,基于RSI-CB的深度学习模型在遥感图像分类任务中取得了显著的性能提升,推动了遥感图像处理技术的进步。其次,RSI-CB的众包数据构建方法为其他遥感数据集的开发提供了新的思路,尤其是在大规模数据标注和数据集扩展方面。此外,RSI-CB的成功应用还促进了弱监督学习和迁移学习在遥感领域的研究,进一步拓展了其在实际应用中的潜力。
以上内容由遇见数据集搜集并总结生成



