five

ARD100|无人机检测数据集|目标识别数据集

收藏
arXiv2025-03-10 更新2025-03-12 收录
无人机检测
目标识别
下载链接:
https://github.com/Irisky123/YOLOMG
下载链接
链接失效反馈
资源简介:
ARD100数据集由西湖大学人工智能系创建,包含100个视频序列,总计202,467帧,采用DJI Mavic2或DJI M300相机在低中度海拔拍摄。该数据集涵盖了复杂背景、低光与强光条件、突然的相机移动、快速移动的无人机以及极小的无人机等多种现实世界挑战。数据集中的目标平均尺寸仅为帧大小的0.01%,是目前已有空对空无人机检测数据集中目标尺寸最小的一个。
提供机构:
西湖大学人工智能系
创建时间:
2025-03-10
AI搜集汇总
数据集介绍
main_image_url
构建方式
ARD100数据集的构建方式独具匠心。该数据集由100个视频序列组成,包含202,467帧图像,视频采集自DJI Mavic2或DJI M300相机,拍摄高度为低中空。视频内容涵盖了复杂的城市背景、低光和强光条件、突发的相机运动、快速移动的无人机以及极小的无人机等挑战性场景。所有视频均以30 FPS的帧率录制,分辨率为1920 × 1080像素。数据集被分为训练集和测试集,其中65个视频用于训练,35个视频用于测试,以确保模型的泛化能力和鲁棒性。
特点
ARD100数据集的特点在于其涵盖了多种挑战性场景,包括复杂的城市背景、低光和强光条件、突发的相机运动、快速移动的无人机以及极小的无人机。这使得数据集在无人机检测和跟踪研究中具有很高的实用价值。此外,ARD100数据集中的目标对象平均尺寸仅为帧大小的0.01%,是现有无人机检测数据集中最小的,这使得数据集在极小目标检测方面具有独特优势。
使用方法
ARD100数据集的使用方法主要包括两个方面:训练和测试。在训练阶段,研究者可以使用数据集中的视频序列来训练他们的无人机检测模型。由于数据集中包含了多种挑战性场景,因此训练出的模型将具有很高的泛化能力和鲁棒性。在测试阶段,研究者可以使用数据集中的测试集来评估他们模型的性能。由于测试集包括了训练集中没有的场景,因此评估结果将更加全面和准确。
背景与挑战
背景概述
随着无人机技术的飞速发展,基于视觉的无人机间检测技术在诸多领域,如视觉编队、空中避障和恶意无人机检测中扮演着至关重要的角色。然而,在复杂背景或目标尺寸极小的场景下,现有方法往往难以有效识别无人机。为了解决这一问题,Hanqing Guo等人提出了一种名为YOLOMG的端到端框架,该框架利用运动引导准确地在复杂环境中识别小型无人机。该研究通过创建运动差异图来捕捉小型无人机的运动特征,并将其与RGB图像结合使用双模态融合模块,以自适应地学习无人机的特征。最后,通过基于YOLOv5框架的增强型骨干网络和检测头处理融合特征图,以实现准确的检测结果。为了验证该方法的有效性,研究团队提出了一个新的数据集ARD100,该数据集包含100个视频(202,467帧),涵盖了各种具有挑战性的条件,并且与现有的无人机检测数据集相比,具有最小的平均目标尺寸。在ARD100和NPS-Drones数据集上的广泛实验表明,该方法在具有挑战性的条件下表现优异,并且在各种指标上超越了最先进的算法。该研究团队在https://github.com/Irisky123/YOLOMG上公开发布了代码和ARD100数据集。
当前挑战
ARD100数据集和相关研究面临的挑战主要包括:1) 解决的领域问题:在复杂背景或目标尺寸极小的场景下,如何准确识别无人机。2) 构建过程中所遇到的挑战:在运动引导下,如何有效提取和融合无人机的运动特征,以及如何在保持模型轻量化的同时,提高检测精度和泛化能力。
常用场景
经典使用场景
在复杂的背景下,如城市环境、树木丛生或建筑物密集的地区,以及当目标无人机与背景融合在一起时,传统的无人机检测方法往往失效。ARD100数据集的经典使用场景正是针对这些挑战性条件。该数据集包含了大量的视频片段,其中无人机目标通常非常小,平均目标大小仅为帧大小的0.01%,这使得它成为研究小目标检测的理想选择。通过利用运动引导技术,YOLOMG框架能够准确地在这些复杂环境中识别小型无人机。
衍生相关工作
ARD100数据集的发布衍生了许多相关的工作。例如,一些研究人员利用该数据集来评估和改进他们的无人机检测算法。此外,一些研究人员还利用该数据集来开发新的算法,以解决无人机检测中的挑战性问题。例如,一些研究人员利用该数据集来开发基于运动信息的无人机检测算法,这些算法可以在目标无人机非常小或背景非常复杂的情况下,准确地识别它们。
数据集最近研究
最新研究方向
基于视觉的无人机对无人机检测技术在众多任务中的应用越来越受到关注,如基于视觉的集群、空中避障和恶意无人机检测。然而,现有的方法在背景复杂或目标微小时往往失效。本文提出了一种新颖的端到端框架,利用运动引导在复杂环境中准确识别小型无人机。首先,创建运动差异图以捕获小型无人机的运动特征。然后,使用双模态融合模块将此运动差异图与RGB图像结合,以适应性地学习无人机的特征。最后,将融合的特征图通过基于YOLOv5框架的增强后端和检测头进行处理,以实现准确的检测结果。为了验证我们的方法,我们提出了一个新的数据集,名为ARD100,该数据集包含100个视频(202,467帧),涵盖各种具有挑战性的条件,并且与现有的无人机检测数据集相比,平均目标尺寸最小。在ARD100和NPS-Drones数据集上的广泛实验表明,我们提出的检测器在具有挑战性的条件下表现出色,并且在各种指标上超越了最先进的算法。我们在https://github.com/Irisky123/YOLOMG上公开发布了代码和ARD100数据集。
相关研究论文
  • 1
    YOLOMG: Vision-based Drone-to-Drone Detection with Appearance and Pixel-Level Motion Fusion西湖大学人工智能系 · 2025年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

PCLT20K

PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。

arXiv 收录

TCIA

TCIA(The Cancer Imaging Archive)是一个公开的癌症影像数据集,包含多种癌症类型的医学影像数据,如CT、MRI、PET等。这些数据通常与临床和病理信息相结合,用于癌症研究和临床试验。

www.cancerimagingarchive.net 收录

豆瓣数据集

该数据集通过爬虫技术从豆瓣网站获取了48223条电影数据,并与movielens ml-latest数据集通过共同的imdb字段进行交集处理,最终得到15752条共同数据。数据存储格式为JSON,支持导入到MongoDB或其他数据库使用。

github 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录