DOTA
收藏arXiv2019-05-19 更新2024-06-21 收录
下载链接:
https://captain-whu.github.io/DOTA/
下载链接
链接失效反馈官方服务:
资源简介:
DOTA是由武汉大学创建的大规模航空图像目标检测数据集,包含2806张约4000×4000像素的图像,涵盖了15种常见目标类别,总计188,282个实例。数据集通过众包方式收集,由航空图像解释专家进行详细标注,每个实例使用任意(8自由度)四边形进行标记。DOTA旨在推动地球视觉(地球观测与遥感)中的目标检测研究,特别适用于解决航空图像中目标的尺度、方向和形状变化巨大的问题。
DOTA is a large-scale aerial image object detection dataset developed by Wuhan University. It comprises 2806 images with a resolution of approximately 4000×4000 pixels, covering 15 common object categories and containing a total of 188,282 annotated instances. The dataset was collected through crowdsourcing and meticulously annotated by aerial image interpretation experts, with each instance labeled using an arbitrary (8-degree-of-freedom) quadrilateral. DOTA is designed to advance object detection research in geovision (earth observation and remote sensing), and is particularly well-suited for addressing the challenges posed by extreme variations in object scale, orientation and shape in aerial images.
提供机构:
武汉大学
创建时间:
2017-11-29
搜集汇总
数据集介绍

构建方式
DOTA数据集通过收集来自不同传感器和平台的2806张高分辨率(约4000 × 4000像素)航空图像构建而成。这些图像涵盖了广泛的对象尺度、方向和形状,并由航空图像解释专家进行了15个常见对象类别的详细标注。每个对象实例均通过任意四边形(8自由度)进行标注,确保了标注的精确性和灵活性。
特点
DOTA数据集以其大规模、多样性和高复杂性著称。它包含了188,282个标注实例,涵盖了15个对象类别,每个图像平均包含67.10个实例,远超其他通用对象检测数据集。此外,DOTA特别强调了对象的任意方向和复杂场景的真实性,使其成为航空图像对象检测研究的理想基准。
使用方法
DOTA数据集适用于开发和评估航空图像中的对象检测算法。研究者可以使用该数据集训练和测试基于深度学习的检测模型,如Faster R-CNN、R-FCN、YOLOv2和SSD。通过在DOTA上的实验,可以评估算法在处理大规模、多方向和复杂场景对象检测任务中的性能,并为未来的算法改进提供基准。
背景与挑战
背景概述
在地球视觉领域,目标检测一直是一个重要且具有挑战性的问题。尽管过去十年中自然场景中的目标检测取得了显著进展,但这些成功在航空图像中的应用却相对滞后。这主要归因于地球表面物体实例的尺度、方向和形状的巨大变化,以及航空场景中标注良好的数据集的稀缺性。为了推动地球视觉中的目标检测研究,武汉大学、华中科技大学等机构的研究人员于2019年推出了大规模航空图像目标检测数据集DOTA。该数据集收集了来自不同传感器和平台的2806张航空图像,每张图像大小约为4000 × 4000像素,包含多种尺度、方向和形状的物体。DOTA数据集通过专家标注,涵盖了15个常见物体类别,共计188,282个实例,每个实例由一个任意方向的四边形标注。DOTA的推出不仅为航空图像中的目标检测提供了基准,还为地球视觉领域的研究提供了宝贵的资源。
当前挑战
DOTA数据集在构建过程中面临了多重挑战。首先,航空图像中物体实例的尺度变化巨大,不仅受传感器空间分辨率的影响,还受同一类别内物体大小的变化影响。其次,许多小物体实例在航空图像中密集分布,例如港口中的船只和停车场中的车辆,这增加了检测的难度。此外,航空图像中的物体常常以任意方向出现,甚至有些实例具有极大的长宽比,如桥梁。这些特点使得传统的目标检测算法难以直接应用于航空图像。此外,数据集偏差问题也是一大挑战,即不同数据集之间的泛化能力通常较低。为了缓解这一问题,DOTA数据集的标注力求反映真实世界应用的需求,从而提高模型的泛化能力。
常用场景
经典使用场景
DOTA数据集在地球视觉领域中被广泛用于目标检测任务,特别是在航空图像中。其经典使用场景包括对飞机、船舶、车辆等目标的定位与分类。由于DOTA数据集包含了大量不同尺度、方向和形状的目标实例,因此它为开发和评估航空图像中的目标检测算法提供了丰富的资源。
解决学术问题
DOTA数据集解决了航空图像目标检测中的多个学术研究问题,如目标尺度变化大、方向任意、形状多样等挑战。通过提供大规模、多样化的标注数据,DOTA促进了深度学习算法在航空图像目标检测中的应用,推动了地球视觉领域的研究进展。
衍生相关工作
DOTA数据集的发布催生了大量相关研究工作,特别是在航空图像目标检测领域。许多研究者基于DOTA数据集开发了新的目标检测算法,并在此基础上进行了性能评估和改进。此外,DOTA还激发了对多方向目标检测和密集目标检测等新兴研究方向的探索。
以上内容由遇见数据集搜集并总结生成



