DOTA

Name: DOTA
Creator: 武汉大学
Published: 2019-05-19 16:07:35
License: 暂无描述

arXiv2019-05-19 更新2024-06-21 收录

下载链接：

https://captain-whu.github.io/DOTA/

下载链接

链接失效反馈

官方服务：

资源简介：

DOTA是由武汉大学创建的大规模航空图像目标检测数据集，包含2806张约4000×4000像素的图像，涵盖了15种常见目标类别，总计188,282个实例。数据集通过众包方式收集，由航空图像解释专家进行详细标注，每个实例使用任意（8自由度）四边形进行标记。DOTA旨在推动地球视觉（地球观测与遥感）中的目标检测研究，特别适用于解决航空图像中目标的尺度、方向和形状变化巨大的问题。

DOTA is a large-scale aerial image object detection dataset developed by Wuhan University. It comprises 2806 images with a resolution of approximately 4000×4000 pixels, covering 15 common object categories and containing a total of 188,282 annotated instances. The dataset was collected through crowdsourcing and meticulously annotated by aerial image interpretation experts, with each instance labeled using an arbitrary (8-degree-of-freedom) quadrilateral. DOTA is designed to advance object detection research in geovision (earth observation and remote sensing), and is particularly well-suited for addressing the challenges posed by extreme variations in object scale, orientation and shape in aerial images.

提供机构：

武汉大学

创建时间：

2017-11-29

搜集汇总

数据集介绍

构建方式

DOTA数据集通过收集来自不同传感器和平台的2806张高分辨率（约4000 × 4000像素）航空图像构建而成。这些图像涵盖了广泛的对象尺度、方向和形状，并由航空图像解释专家进行了15个常见对象类别的详细标注。每个对象实例均通过任意四边形（8自由度）进行标注，确保了标注的精确性和灵活性。

特点

DOTA数据集以其大规模、多样性和高复杂性著称。它包含了188,282个标注实例，涵盖了15个对象类别，每个图像平均包含67.10个实例，远超其他通用对象检测数据集。此外，DOTA特别强调了对象的任意方向和复杂场景的真实性，使其成为航空图像对象检测研究的理想基准。

使用方法

DOTA数据集适用于开发和评估航空图像中的对象检测算法。研究者可以使用该数据集训练和测试基于深度学习的检测模型，如Faster R-CNN、R-FCN、YOLOv2和SSD。通过在DOTA上的实验，可以评估算法在处理大规模、多方向和复杂场景对象检测任务中的性能，并为未来的算法改进提供基准。

背景与挑战

背景概述

在地球视觉领域，目标检测一直是一个重要且具有挑战性的问题。尽管过去十年中自然场景中的目标检测取得了显著进展，但这些成功在航空图像中的应用却相对滞后。这主要归因于地球表面物体实例的尺度、方向和形状的巨大变化，以及航空场景中标注良好的数据集的稀缺性。为了推动地球视觉中的目标检测研究，武汉大学、华中科技大学等机构的研究人员于2019年推出了大规模航空图像目标检测数据集DOTA。该数据集收集了来自不同传感器和平台的2806张航空图像，每张图像大小约为4000 × 4000像素，包含多种尺度、方向和形状的物体。DOTA数据集通过专家标注，涵盖了15个常见物体类别，共计188,282个实例，每个实例由一个任意方向的四边形标注。DOTA的推出不仅为航空图像中的目标检测提供了基准，还为地球视觉领域的研究提供了宝贵的资源。

当前挑战

DOTA数据集在构建过程中面临了多重挑战。首先，航空图像中物体实例的尺度变化巨大，不仅受传感器空间分辨率的影响，还受同一类别内物体大小的变化影响。其次，许多小物体实例在航空图像中密集分布，例如港口中的船只和停车场中的车辆，这增加了检测的难度。此外，航空图像中的物体常常以任意方向出现，甚至有些实例具有极大的长宽比，如桥梁。这些特点使得传统的目标检测算法难以直接应用于航空图像。此外，数据集偏差问题也是一大挑战，即不同数据集之间的泛化能力通常较低。为了缓解这一问题，DOTA数据集的标注力求反映真实世界应用的需求，从而提高模型的泛化能力。

常用场景

经典使用场景

DOTA数据集在地球视觉领域中被广泛用于目标检测任务，特别是在航空图像中。其经典使用场景包括对飞机、船舶、车辆等目标的定位与分类。由于DOTA数据集包含了大量不同尺度、方向和形状的目标实例，因此它为开发和评估航空图像中的目标检测算法提供了丰富的资源。

解决学术问题

DOTA数据集解决了航空图像目标检测中的多个学术研究问题，如目标尺度变化大、方向任意、形状多样等挑战。通过提供大规模、多样化的标注数据，DOTA促进了深度学习算法在航空图像目标检测中的应用，推动了地球视觉领域的研究进展。

衍生相关工作

DOTA数据集的发布催生了大量相关研究工作，特别是在航空图像目标检测领域。许多研究者基于DOTA数据集开发了新的目标检测算法，并在此基础上进行了性能评估和改进。此外，DOTA还激发了对多方向目标检测和密集目标检测等新兴研究方向的探索。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集