UAV3D

Name: UAV3D
Creator: 佐治亚州立大学
Published: 2024-10-15 06:24:11
License: 暂无描述

arXiv2024-10-15 更新2024-10-17 收录

下载链接：

https://huiyegit.github.io/UAV3D_Benchmark/

下载链接

链接失效反馈

官方服务：

资源简介：

UAV3D是由佐治亚州立大学和康涅狄格大学联合创建的一个大规模3D感知基准数据集，专为无人机应用设计。该数据集包含500,000张图像，覆盖1000个场景，每个场景有20帧，每帧都标注了3D边界框，支持四项3D感知任务。数据集通过CARLA和AirSim模拟器创建，模拟了复杂的交通情况和多无人机协作场景。UAV3D旨在推动无人机在3D环境中的物体检测和跟踪研究，解决现有2D数据集在3D感知能力上的不足。

UAV3D is a large-scale 3D perception benchmark dataset jointly created by Georgia State University and the University of Connecticut, specifically designed for unmanned aerial vehicle (UAV) applications. This dataset includes 500,000 images spanning 1000 unique scenes, with 20 frames per scene. Each frame is annotated with 3D bounding boxes, and the dataset supports four distinct 3D perception tasks. The dataset is generated using the CARLA and AirSim simulators, which simulate complex traffic scenarios and multi-UAV collaboration environments. UAV3D aims to promote research on object detection and tracking for UAVs in 3D environments, addressing the shortcomings of existing 2D datasets in terms of 3D perception capabilities.

提供机构：

佐治亚州立大学

创建时间：

2024-10-15

原始信息汇总

UAV3D: A Large-scale 3D Perception Benchmark for Unmanned Aerial Vehicles

数据集概述

UAV3D是一个为无人机平台设计的公开大规模3D感知基准数据集。该数据集包含合成数据和3D感知算法，旨在促进单无人机和协作无人机3D感知任务的研究。

数据集组成

场景数量: 1,000个场景
- 训练集: 700个场景
- 验证集: 150个场景
- 测试集: 150个场景
图像数量: 500,000张RGB图像
3D框数量: 3,300,000个

场景规划

地点: 城市区域（Towns 3和10）和郊区区域（Towns 6和7）
飞行路线: 每个地图从左下到右上250条路线
场景分布: 700个训练场景，150个验证场景，150个测试场景

传感器设置

RGB相机位置: 前、左、右、中心和后
旋转角度: 底部相机提供鸟瞰图，其他四个相机俯仰角为-45度
分辨率: 800x450像素

无人机编队

编队形状: 十字形编队，前、左、右、中心和后
距离: 每个无人机距离中心无人机20米
高度: 无人机编队在60米高度保持编队

数据格式

标注类型: 3D边界框和像素级语义标签
3D框定义: 中心位置（x, y, z坐标）、尺寸（宽度、长度、高度）和方向角度（偏航、俯仰、横滚）
车辆类别: 27个类别

搜集汇总

数据集介绍

构建方式

UAV3D数据集通过利用CARLA和AirSim模拟器进行构建，这两个模拟器分别用于交通流量模拟和数据记录。在CARLA中，车辆被随机生成并在城镇中导航，而AirSim则用于模拟飞行无人机。每个无人机配备五个RGB摄像头，以同步记录图像数据。数据集包含1000个场景，每个场景有20帧，每帧包含来自五个无人机的25张图像。通过这种方式，UAV3D数据集提供了丰富的3D感知任务所需的多视角图像数据。

特点

UAV3D数据集的一个显著特点是其大规模和多样性。该数据集包含500,000张图像和330万个3D边界框标注，覆盖了四个不同的城镇，提供了城市和郊区两种不同的交通环境。此外，数据集还提供了多种标注，包括3D边界框、车辆轨迹和语义标签，支持多种下游任务，如检测、跟踪和语义分割。

使用方法

UAV3D数据集适用于多种3D感知任务的研究，包括单无人机3D物体检测、单无人机物体跟踪、协作无人机3D物体检测和协作无人机物体跟踪。研究者可以使用数据集中的图像和标注来训练和评估模型。数据集的格式与nuScenes数据集兼容，便于使用现有的nuScenes开发工具包进行处理和分析。

背景与挑战

背景概述

UAV3D数据集由佐治亚州立大学和康涅狄格大学的研究人员于2024年创建，旨在推动无人驾驶飞行器（UAV）在三维感知任务中的研究。该数据集的核心研究问题是如何在复杂环境中实现UAV的3D物体检测和跟踪，特别是在单UAV视角受限的情况下。UAV3D包含了1000个场景，每个场景有20帧，并提供了详细的3D边界框标注，涵盖了单UAV和协作UAV的3D物体检测与跟踪任务。这一数据集的推出填补了现有UAV数据集主要集中在2D感知任务的空白，对推动UAV在实际应用中的3D环境理解具有重要意义。

当前挑战

UAV3D数据集在构建过程中面临多项挑战。首先，如何在高成本和高劳动强度的情况下，通过模拟环境有效生成大规模的3D标注数据是一个主要难题。其次，单UAV在长距离或遮挡区域中的感知能力受限，需要通过UAV之间的协作来提升感知性能。此外，现有的大多数UAV数据集主要针对2D感知任务，而UAV3D则专注于3D感知，这要求研究者开发新的算法和模型来充分利用3D信息。最后，如何确保模拟数据与真实世界数据之间的域适应性，以便模型在实际应用中能够有效迁移，也是一个亟待解决的问题。

常用场景

经典使用场景

UAV3D数据集的经典使用场景主要集中在无人机（UAV）的3D感知任务中，特别是在单无人机和多无人机协作的3D物体检测与跟踪任务中。该数据集通过提供1000个场景，每个场景包含20帧完全标注的3D边界框，支持单无人机和多无人机在复杂环境中的3D感知研究。这些任务对于无人机在空中摄影、监控和农业等应用中的有效部署至关重要。

衍生相关工作

UAV3D数据集的发布催生了一系列相关研究工作，特别是在多无人机协作感知和3D物体检测领域。例如，基于UAV3D数据集的研究已经提出了多种协作感知算法，如When2Com、Who2Com、V2VNet和DiscoNet，这些算法通过优化无人机间的通信策略，显著提升了感知性能。此外，UAV3D还激发了对模拟数据与真实世界数据之间域适应技术的研究，以进一步提升无人机在实际应用中的表现。

数据集最近研究