five

AI-TOD-v2|航空图像物体检测数据集|微小物体检测数据集

收藏
arXiv2022-06-28 更新2024-06-21 收录
航空图像物体检测
微小物体检测
下载链接:
https://chasel-tsui.github.io/AI-TOD-v2/
下载链接
链接失效反馈
资源简介:
AI-TOD-v2数据集是由武汉大学电子信息学院创建的,专门用于航空图像中的微小物体检测。该数据集包含28,036张图像和752,754个实例,平均物体大小仅为12.7像素,是所有目标检测数据集中物体尺寸最小的。AI-TOD-v2数据集通过精心重新标注,显著减少了缺失标注和位置错误的问题,提高了训练和验证过程的可靠性。该数据集的应用领域包括车辆检测、交通状况监控和海上救援等,旨在解决航空图像中微小物体检测的挑战。
提供机构:
武汉大学
创建时间:
2022-06-28
AI搜集汇总
数据集介绍
main_image_url
构建方式
AI-TOD-v2数据集的构建主要基于原始的AI-TOD数据集,并通过专家团队的细致重新标注和优化而来。为了解决AI-TOD数据集中存在的标签噪声问题,研究人员首先使用他们提出的微小物体检测器在AI-TOD数据集上进行训练,并可视化其检测结果。通过这种方式,他们发现了许多被遗漏标注的物体,并将这些信息作为重新标注的线索。随后,他们邀请了武汉大学具有遥感图像解译和计算机视觉背景的志愿者进行大规模的重新标注工作。在标注过程中,志愿者们首先调整他们高度自信的噪声标签,并对那些不确定的物体或标注进行标记。接着,研究团队通过团队合作和投票策略来确定这些物体的精确位置和类别。为了确保标注质量,他们还进行了双盲检查,随机交换不同标注者的标注,并鼓励他们找出他们认为质量较低的标注。
特点
AI-TOD-v2数据集具有以下特点:1. 实例数量:包含28,036张航拍图像和752,745个标注物体实例,比原始AI-TOD数据集增加了52,133个实例。2. 物体类别数量:共有8个类别,包括飞机、桥梁、储罐、船舶、游泳池、车辆、人员和风力发电机。3. 物体尺寸分布:平均绝对物体尺寸仅为12.7像素,是目前所有目标检测数据集中物体尺寸最小的。4. 物体尺寸范围:大部分物体尺寸都在非常小和小的范围内。5. 评估结果:通过相似性检查和统计分析,AI-TOD-v2数据集的标注质量得到了显著提高,与NWD-RKA方法的预测结果相比,AP指标仅在33.0 AP左右。
使用方法
使用AI-TOD-v2数据集的方法如下:1. 数据准备:下载AI-TOD-v2数据集和相应的标注文件。2. 数据预处理:将图像和标注文件转换为模型可接受的格式,例如将图像裁剪为固定大小并归一化。3. 模型选择:选择合适的锚框式目标检测器,例如Faster R-CNN、Cascade R-CNN或DetectoRS。4. 模型训练:使用AI-TOD-v2数据集训练选定的目标检测器,并使用NWD-RKA策略进行训练样本分配。5. 模型评估:使用AI-TOD-v2测试集评估模型的性能,并与其他基线模型进行比较。6. 模型优化:根据实验结果调整模型参数和训练策略,以提高检测性能。
背景与挑战
背景概述
AI-TOD-v2数据集是针对航空图像中小目标检测(TOD)任务而设计的,由武汉大学电子信息学院和计算机科学学院的Chang Xua等人于2021年创建。该数据集的创建旨在解决现有目标检测器在处理小目标时的不足,尤其是当小目标仅包含少量像素时,现有目标检测器无法提供满意的结果。为了应对这一挑战,研究人员提出了一个新的评估指标——归一化Wasserstein距离(NWD)和一个新的基于排序的分配(RKA)策略。NWD-RKA策略可以轻松嵌入到各种基于锚点的检测器中,以取代标准的IoU阈值方法,显著提高了标签分配的准确性,并为网络训练提供了足够的监督信息。AI-TOD-v2数据集包含八个类别,共28,036张图像和752,754个实例,是目前所有目标检测数据集中物体尺寸最小的数据集。
当前挑战
AI-TOD-v2数据集所面临的挑战主要来自于航空图像中小目标检测的难度。由于小目标通常只包含少量像素,因此它们的外观信息非常有限,这使得学习区分特征变得非常困难。此外,现有的目标检测基准数据集通常不适用于评估小目标检测器的性能,因为这些数据集中的物体尺寸普遍较大。因此,AI-TOD-v2数据集的创建旨在为小目标检测提供一个更加可靠和全面的基准。在构建过程中,研究人员也面临着数据标注的挑战,例如,小目标容易被复杂的背景混淆,增加了标注的难度和工作量。为了提高标注质量,研究人员邀请了专家对数据集进行了精心标注。
常用场景
经典使用场景
AI-TOD-v2 数据集在航空图像中的微小目标检测任务中扮演着关键角色。该数据集包含了大量微小目标的标注数据,这些数据对于训练和评估微小目标检测算法至关重要。该数据集的一个经典使用场景是训练基于锚框的检测器,如 Faster R-CNN 和 DetectoRS,通过使用 Normalized Wasserstein Distance (NWD) 和 RanKing-based Assigning (RKA) 策略来提高检测性能。此外,AI-TOD-v2 还可以用于研究不同锚框尺寸和正负样本分配阈值对检测性能的影响。
实际应用
AI-TOD-v2 数据集在实际应用中具有广泛的应用场景。例如,在车辆检测、交通状况监控和海上救援等任务中,微小目标的准确检测对于确保安全、提高效率至关重要。此外,该数据集还可以用于研究如何在不同背景下提高微小目标的检测性能,例如在复杂和多样的背景下。AI-TOD-v2 数据集的发布为这些应用场景提供了高质量的数据支持,有助于推动相关技术的发展。
衍生相关工作
AI-TOD-v2 数据集的发布衍生了许多相关的研究工作。例如,一些研究致力于改进 NWD-RKA 策略,以进一步提高检测性能。此外,一些研究使用 AI-TOD-v2 数据集来评估和比较不同的微小目标检测算法,以推动算法的发展。此外,该数据集还促进了与其他航空图像数据集的比较研究,以更好地理解微小目标检测的挑战和机遇。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

data

食神オリジナルデータ

github 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

Plant-Diseases

Dataset for Plant Diseases containg variours Plant Disease

kaggle 收录

SWaT Dataset

SWaT Dataset是一个用于工业控制系统(ICS)安全研究的数据集,包含了模拟的网络攻击和正常操作的数据。该数据集由新加坡科技设计大学(Singapore University of Technology and Design)发布,旨在帮助研究人员开发和测试用于检测工业控制系统中网络攻击的算法和模型。

itrust.sutd.edu.sg 收录