AI-TOD-v2

arXiv2022-06-28 更新2024-06-21 收录

下载链接：

https://chasel-tsui.github.io/AI-TOD-v2/

下载链接

链接失效反馈

资源简介：

AI-TOD-v2数据集是由武汉大学电子信息学院创建的，专门用于航空图像中的微小物体检测。该数据集包含28,036张图像和752,754个实例，平均物体大小仅为12.7像素，是所有目标检测数据集中物体尺寸最小的。AI-TOD-v2数据集通过精心重新标注，显著减少了缺失标注和位置错误的问题，提高了训练和验证过程的可靠性。该数据集的应用领域包括车辆检测、交通状况监控和海上救援等，旨在解决航空图像中微小物体检测的挑战。

The AI-TOD-v2 dataset was created by the School of Electronic Information, Wuhan University, and is specifically designed for tiny object detection in aerial images. It comprises 28,036 images and 752,754 object instances, with an average object size of merely 12.7 pixels, making it the object detection dataset with the smallest average object size across all existing datasets. The AI-TOD-v2 dataset has undergone meticulous re-annotation, which significantly reduces the issues of missing annotations and positional errors, thereby enhancing the reliability of training and validation processes. Its application scenarios include vehicle detection, traffic condition monitoring, maritime rescue and other related fields, aiming to address the challenges of tiny object detection in aerial images.

提供机构：

武汉大学

创建时间：

2022-06-28

AI搜集汇总

数据集介绍

构建方式

AI-TOD-v2数据集的构建主要基于原始的AI-TOD数据集，并通过专家团队的细致重新标注和优化而来。为了解决AI-TOD数据集中存在的标签噪声问题，研究人员首先使用他们提出的微小物体检测器在AI-TOD数据集上进行训练，并可视化其检测结果。通过这种方式，他们发现了许多被遗漏标注的物体，并将这些信息作为重新标注的线索。随后，他们邀请了武汉大学具有遥感图像解译和计算机视觉背景的志愿者进行大规模的重新标注工作。在标注过程中，志愿者们首先调整他们高度自信的噪声标签，并对那些不确定的物体或标注进行标记。接着，研究团队通过团队合作和投票策略来确定这些物体的精确位置和类别。为了确保标注质量，他们还进行了双盲检查，随机交换不同标注者的标注，并鼓励他们找出他们认为质量较低的标注。

特点

AI-TOD-v2数据集具有以下特点：1. 实例数量：包含28,036张航拍图像和752,745个标注物体实例，比原始AI-TOD数据集增加了52,133个实例。2. 物体类别数量：共有8个类别，包括飞机、桥梁、储罐、船舶、游泳池、车辆、人员和风力发电机。3. 物体尺寸分布：平均绝对物体尺寸仅为12.7像素，是目前所有目标检测数据集中物体尺寸最小的。4. 物体尺寸范围：大部分物体尺寸都在非常小和小的范围内。5. 评估结果：通过相似性检查和统计分析，AI-TOD-v2数据集的标注质量得到了显著提高，与NWD-RKA方法的预测结果相比，AP指标仅在33.0 AP左右。

使用方法

使用AI-TOD-v2数据集的方法如下：1. 数据准备：下载AI-TOD-v2数据集和相应的标注文件。2. 数据预处理：将图像和标注文件转换为模型可接受的格式，例如将图像裁剪为固定大小并归一化。3. 模型选择：选择合适的锚框式目标检测器，例如Faster R-CNN、Cascade R-CNN或DetectoRS。4. 模型训练：使用AI-TOD-v2数据集训练选定的目标检测器，并使用NWD-RKA策略进行训练样本分配。5. 模型评估：使用AI-TOD-v2测试集评估模型的性能，并与其他基线模型进行比较。6. 模型优化：根据实验结果调整模型参数和训练策略，以提高检测性能。

背景与挑战

背景概述

AI-TOD-v2数据集是针对航空图像中小目标检测（TOD）任务而设计的，由武汉大学电子信息学院和计算机科学学院的Chang Xua等人于2021年创建。该数据集的创建旨在解决现有目标检测器在处理小目标时的不足，尤其是当小目标仅包含少量像素时，现有目标检测器无法提供满意的结果。为了应对这一挑战，研究人员提出了一个新的评估指标——归一化Wasserstein距离（NWD）和一个新的基于排序的分配（RKA）策略。NWD-RKA策略可以轻松嵌入到各种基于锚点的检测器中，以取代标准的IoU阈值方法，显著提高了标签分配的准确性，并为网络训练提供了足够的监督信息。AI-TOD-v2数据集包含八个类别，共28,036张图像和752,754个实例，是目前所有目标检测数据集中物体尺寸最小的数据集。

当前挑战

AI-TOD-v2数据集所面临的挑战主要来自于航空图像中小目标检测的难度。由于小目标通常只包含少量像素，因此它们的外观信息非常有限，这使得学习区分特征变得非常困难。此外，现有的目标检测基准数据集通常不适用于评估小目标检测器的性能，因为这些数据集中的物体尺寸普遍较大。因此，AI-TOD-v2数据集的创建旨在为小目标检测提供一个更加可靠和全面的基准。在构建过程中，研究人员也面临着数据标注的挑战，例如，小目标容易被复杂的背景混淆，增加了标注的难度和工作量。为了提高标注质量，研究人员邀请了专家对数据集进行了精心标注。

常用场景

经典使用场景

AI-TOD-v2 数据集在航空图像中的微小目标检测任务中扮演着关键角色。该数据集包含了大量微小目标的标注数据，这些数据对于训练和评估微小目标检测算法至关重要。该数据集的一个经典使用场景是训练基于锚框的检测器，如 Faster R-CNN 和 DetectoRS，通过使用 Normalized Wasserstein Distance (NWD) 和 RanKing-based Assigning (RKA) 策略来提高检测性能。此外，AI-TOD-v2 还可以用于研究不同锚框尺寸和正负样本分配阈值对检测性能的影响。

实际应用

AI-TOD-v2 数据集在实际应用中具有广泛的应用场景。例如，在车辆检测、交通状况监控和海上救援等任务中，微小目标的准确检测对于确保安全、提高效率至关重要。此外，该数据集还可以用于研究如何在不同背景下提高微小目标的检测性能，例如在复杂和多样的背景下。AI-TOD-v2 数据集的发布为这些应用场景提供了高质量的数据支持，有助于推动相关技术的发展。

衍生相关工作

AI-TOD-v2 数据集的发布衍生了许多相关的研究工作。例如，一些研究致力于改进 NWD-RKA 策略，以进一步提高检测性能。此外，一些研究使用 AI-TOD-v2 数据集来评估和比较不同的微小目标检测算法，以推动算法的发展。此外，该数据集还促进了与其他航空图像数据集的比较研究，以更好地理解微小目标检测的挑战和机遇。

以上内容由AI搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集