five

AI-TOD-v2|航空图像物体检测数据集|微小物体检测数据集

收藏
arXiv2022-06-28 更新2024-06-21 收录
航空图像物体检测
微小物体检测
下载链接:
https://chasel-tsui.github.io/AI-TOD-v2/
下载链接
链接失效反馈
资源简介:
AI-TOD-v2数据集是由武汉大学电子信息学院创建的,专门用于航空图像中的微小物体检测。该数据集包含28,036张图像和752,754个实例,平均物体大小仅为12.7像素,是所有目标检测数据集中物体尺寸最小的。AI-TOD-v2数据集通过精心重新标注,显著减少了缺失标注和位置错误的问题,提高了训练和验证过程的可靠性。该数据集的应用领域包括车辆检测、交通状况监控和海上救援等,旨在解决航空图像中微小物体检测的挑战。
提供机构:
武汉大学
创建时间:
2022-06-28
AI搜集汇总
数据集介绍
main_image_url
构建方式
AI-TOD-v2数据集的构建主要基于原始的AI-TOD数据集,并通过专家团队的细致重新标注和优化而来。为了解决AI-TOD数据集中存在的标签噪声问题,研究人员首先使用他们提出的微小物体检测器在AI-TOD数据集上进行训练,并可视化其检测结果。通过这种方式,他们发现了许多被遗漏标注的物体,并将这些信息作为重新标注的线索。随后,他们邀请了武汉大学具有遥感图像解译和计算机视觉背景的志愿者进行大规模的重新标注工作。在标注过程中,志愿者们首先调整他们高度自信的噪声标签,并对那些不确定的物体或标注进行标记。接着,研究团队通过团队合作和投票策略来确定这些物体的精确位置和类别。为了确保标注质量,他们还进行了双盲检查,随机交换不同标注者的标注,并鼓励他们找出他们认为质量较低的标注。
特点
AI-TOD-v2数据集具有以下特点:1. 实例数量:包含28,036张航拍图像和752,745个标注物体实例,比原始AI-TOD数据集增加了52,133个实例。2. 物体类别数量:共有8个类别,包括飞机、桥梁、储罐、船舶、游泳池、车辆、人员和风力发电机。3. 物体尺寸分布:平均绝对物体尺寸仅为12.7像素,是目前所有目标检测数据集中物体尺寸最小的。4. 物体尺寸范围:大部分物体尺寸都在非常小和小的范围内。5. 评估结果:通过相似性检查和统计分析,AI-TOD-v2数据集的标注质量得到了显著提高,与NWD-RKA方法的预测结果相比,AP指标仅在33.0 AP左右。
使用方法
使用AI-TOD-v2数据集的方法如下:1. 数据准备:下载AI-TOD-v2数据集和相应的标注文件。2. 数据预处理:将图像和标注文件转换为模型可接受的格式,例如将图像裁剪为固定大小并归一化。3. 模型选择:选择合适的锚框式目标检测器,例如Faster R-CNN、Cascade R-CNN或DetectoRS。4. 模型训练:使用AI-TOD-v2数据集训练选定的目标检测器,并使用NWD-RKA策略进行训练样本分配。5. 模型评估:使用AI-TOD-v2测试集评估模型的性能,并与其他基线模型进行比较。6. 模型优化:根据实验结果调整模型参数和训练策略,以提高检测性能。
背景与挑战
背景概述
AI-TOD-v2数据集是针对航空图像中小目标检测(TOD)任务而设计的,由武汉大学电子信息学院和计算机科学学院的Chang Xua等人于2021年创建。该数据集的创建旨在解决现有目标检测器在处理小目标时的不足,尤其是当小目标仅包含少量像素时,现有目标检测器无法提供满意的结果。为了应对这一挑战,研究人员提出了一个新的评估指标——归一化Wasserstein距离(NWD)和一个新的基于排序的分配(RKA)策略。NWD-RKA策略可以轻松嵌入到各种基于锚点的检测器中,以取代标准的IoU阈值方法,显著提高了标签分配的准确性,并为网络训练提供了足够的监督信息。AI-TOD-v2数据集包含八个类别,共28,036张图像和752,754个实例,是目前所有目标检测数据集中物体尺寸最小的数据集。
当前挑战
AI-TOD-v2数据集所面临的挑战主要来自于航空图像中小目标检测的难度。由于小目标通常只包含少量像素,因此它们的外观信息非常有限,这使得学习区分特征变得非常困难。此外,现有的目标检测基准数据集通常不适用于评估小目标检测器的性能,因为这些数据集中的物体尺寸普遍较大。因此,AI-TOD-v2数据集的创建旨在为小目标检测提供一个更加可靠和全面的基准。在构建过程中,研究人员也面临着数据标注的挑战,例如,小目标容易被复杂的背景混淆,增加了标注的难度和工作量。为了提高标注质量,研究人员邀请了专家对数据集进行了精心标注。
常用场景
经典使用场景
AI-TOD-v2 数据集在航空图像中的微小目标检测任务中扮演着关键角色。该数据集包含了大量微小目标的标注数据,这些数据对于训练和评估微小目标检测算法至关重要。该数据集的一个经典使用场景是训练基于锚框的检测器,如 Faster R-CNN 和 DetectoRS,通过使用 Normalized Wasserstein Distance (NWD) 和 RanKing-based Assigning (RKA) 策略来提高检测性能。此外,AI-TOD-v2 还可以用于研究不同锚框尺寸和正负样本分配阈值对检测性能的影响。
实际应用
AI-TOD-v2 数据集在实际应用中具有广泛的应用场景。例如,在车辆检测、交通状况监控和海上救援等任务中,微小目标的准确检测对于确保安全、提高效率至关重要。此外,该数据集还可以用于研究如何在不同背景下提高微小目标的检测性能,例如在复杂和多样的背景下。AI-TOD-v2 数据集的发布为这些应用场景提供了高质量的数据支持,有助于推动相关技术的发展。
衍生相关工作
AI-TOD-v2 数据集的发布衍生了许多相关的研究工作。例如,一些研究致力于改进 NWD-RKA 策略,以进一步提高检测性能。此外,一些研究使用 AI-TOD-v2 数据集来评估和比较不同的微小目标检测算法,以推动算法的发展。此外,该数据集还促进了与其他航空图像数据集的比较研究,以更好地理解微小目标检测的挑战和机遇。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国劳动力动态调查

“中国劳动力动态调查” (China Labor-force Dynamics Survey,简称 CLDS)是“985”三期“中山大学社会科学特色数据库建设”专项内容,CLDS的目的是通过对中国城乡以村/居为追踪范围的家庭、劳动力个体开展每两年一次的动态追踪调查,系统地监测村/居社区的社会结构和家庭、劳动力个体的变化与相互影响,建立劳动力、家庭和社区三个层次上的追踪数据库,从而为进行实证导向的高质量的理论研究和政策研究提供基础数据。

中国学术调查数据资料库 收录

stanford_cars

该数据集是一个包含多个汽车品牌和型号的图片数据集,每个图片样本都标记有相应的汽车品牌和型号信息。数据集适用于图像识别和分类任务,特别是汽车品牌和型号的识别。

huggingface 收录

China Health and Nutrition Survey (CHNS)

China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。

www.cpc.unc.edu 收录

WikiArt

为了收集我们的美术作品集,我们使用了公开的 “维基艺术绘画” 数据集4 ;据我们所知,这是最大的数字化艺术品在线公开收藏。这个收藏有从十五个世纪到当代艺术家的1,119艺术家的81,449精工画的图像。 这些绘画来自27种不同的风格 (抽象,拜占庭,巴洛克等) 和 45种不同的流派 (室内、风景等)先前的作品 [26,9] 使用了不同的资源,并制作了较小的收藏,在风格,流派方面的可变性有限 和艺术家。[4] 的工作在数据收集程序方面最接近我们的工作,但是他们收集的图像数量是我们的一半。

OpenDataLab 收录

猫狗图像数据集

该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。

github 收录