UAVid
收藏arXiv2020-05-18 更新2024-06-21 收录
下载链接:
https://uavid.nl/
下载链接
链接失效反馈官方服务:
资源简介:
UAVid数据集是由特文特大学等机构创建的高分辨率无人机语义分割数据集,旨在解决城市场景中的复杂视觉理解问题。该数据集包含30个视频序列,总计300张4K高分辨率图像,涵盖8个语义类别,适用于静态和动态对象识别。数据集的创建过程考虑了视角、分辨率和场景复杂性,以确保数据的有效性和实用性。UAVid数据集特别适用于无人机在城市环境中的应用,如交通监控和城市绿化监测,为高级智能应用提供了基础。
The UAVid dataset is a high-resolution drone-based semantic segmentation dataset developed by the University of Twente and other institutions, targeting complex visual understanding problems in urban scenarios. It comprises 30 video sequences, with a total of 300 4K high-resolution images, covering 8 semantic categories, and supports both static and dynamic object recognition tasks. The dataset’s development considers perspectives, resolution and scene complexity to guarantee its validity and practicality. The UAVid dataset is specifically designed for drone applications in urban environments, including traffic monitoring and urban green space monitoring, serving as a fundamental resource for advanced intelligent applications.
提供机构:
特文特大学
创建时间:
2018-10-24
搜集汇总
数据集介绍

构建方式
UAVid数据集的构建旨在捕捉城市场景中的复杂性,通过无人机平台获取高分辨率的倾斜视角图像。该数据集包含30个视频序列,每个序列捕捉4K分辨率的图像,总计300张图像被密集标注为8个类别。数据采集策略包括在50米左右的飞行高度下,以45度角倾斜视角记录图像,确保图像中包含丰富的场景上下文和细节。此外,数据集设计了连续标注策略,每5秒间隔标注10张图像,以评估预测的稳定性。
特点
UAVid数据集的显著特点在于其高分辨率和倾斜视角,这使得数据集能够捕捉到城市场景中的静态和动态对象,提供丰富的上下文信息。数据集的场景复杂性较高,包含多种对象配置和大量对象实例,使其成为研究城市场景语义分割的理想选择。此外,数据集的标注方法包括像素级、超像素级和多边形级标注,确保了标注的精细度和准确性。
使用方法
UAVid数据集适用于语义分割任务,特别是针对城市环境的无人机图像。研究者可以使用该数据集训练和评估深度学习模型,如FCN-8s、Dilation net、U-Net和提出的Multi-Scale-Dilation net。数据集提供了训练、验证和测试集,研究者可以根据需要进行数据分割和模型训练。此外,数据集还提供了未标注的图像,以支持进一步的研究和应用开发。
背景与挑战
背景概述
近年来,语义分割已成为计算机视觉领域的主要研究兴趣之一,为机器人和自动驾驶等众多领域提供了感知基础。随着深度学习相关方法的快速发展,大规模数据集的贡献不可忽视。现有的语义分割数据集,如Cityscapes和CamVid,主要通过车载摄像头捕捉城市复杂场景中的侧视图。此外,还有针对航空图像和卫星图像的语义标注数据集,这些数据集捕捉的是物体的顶视图。然而,从倾斜视角捕捉城市场景的无人机(UAV)数据集却寥寥无几,这种视角能够同时观察到物体的顶视图和侧视图,为物体识别提供了更多信息。UAVid数据集由荷兰特温特大学和中国武汉大学的研究人员于2018年创建,旨在填补这一空白,提供高分辨率的无人机图像语义分割数据集,特别关注城市场景中的大规模尺度变化、移动物体识别和时间一致性保持等挑战。
当前挑战
UAVid数据集在构建过程中面临多项挑战。首先,大规模尺度变化问题显著,不同距离和类别的物体在图像中的大小差异巨大,这对模型的多尺度特征提取能力提出了高要求。其次,移动物体识别,特别是在城市街道场景中,区分移动车辆和静止车辆需要额外的时空信息。最后,保持时间一致性,确保模型在连续帧间的预测稳定性,也是一个重要挑战。此外,数据集的构建还涉及高分辨率图像的密集标注,这不仅耗时且成本高昂,需要高效的标注工具和方法。这些挑战共同构成了UAVid数据集的独特性和研究价值。
常用场景
经典使用场景
UAVid数据集的经典使用场景主要集中在城市街景的语义分割任务上。由于其高分辨率的无人机图像能够捕捉到倾斜视角下的城市景观,包括建筑物、道路、车辆、植被等多种对象,因此该数据集特别适用于开发和评估针对复杂城市环境的语义分割算法。通过利用UAVid数据集,研究人员可以训练和验证其模型在处理大规模对象变化、移动对象识别以及时间一致性保持等方面的能力。
解决学术问题
UAVid数据集解决了现有语义分割数据集在城市街景理解方面的不足,特别是在无人机视角下的数据稀缺问题。该数据集通过提供高分辨率的倾斜视角图像,填补了这一领域的空白,为学术界提供了一个新的基准。这不仅有助于推动语义分割技术的发展,还为城市规划、交通监控和环境监测等应用领域提供了重要的数据支持。
衍生相关工作
UAVid数据集的发布激发了大量相关研究工作,特别是在无人机图像处理和语义分割领域。例如,基于UAVid数据集的研究已经提出了多种改进的语义分割网络,如多尺度膨胀网络(Multi-Scale-Dilation Net),这些网络在处理大规模对象变化和移动对象识别方面表现出色。此外,还有研究探讨了如何利用时间信息进行视频语义分割,进一步提升了模型的性能和应用范围。
以上内容由遇见数据集搜集并总结生成



