Fine-Grained Vehicle Detection (FGVD) Dataset

Name: Fine-Grained Vehicle Detection (FGVD) Dataset
Creator: 印度理工学院德里分校和海得拉巴国际信息技术研究所
Published: 2022-12-30 14:50:15
License: 暂无描述

arXiv2022-12-30 更新2024-08-06 收录

下载链接：

http://arxiv.org/abs/2212.14569v1

下载链接

链接失效反馈

官方服务：

资源简介：

FGVD数据集是由印度理工学院德里分校和海得拉巴国际信息技术研究所创建的，旨在为不受限制的道路环境提供细粒度的车辆检测。该数据集包含5502张场景图像，拥有210个独特的细粒度标签，涵盖多种车辆类型，并采用三级层次结构组织。数据集的创建过程涉及从IDD检测数据集中选择高质量图像，并通过专业的标注团队进行精细标注。FGVD数据集的应用领域包括智能交通监控系统，用于车辆再识别和在密集及遮挡交通场景中的鲁棒检测，解决现有检测模型在处理复杂交通场景时的不足。

The FGVD dataset was developed by the Indian Institute of Technology Delhi and the International Institute of Information Technology Hyderabad, with the goal of facilitating fine-grained vehicle detection in unconstrained road environments. It comprises 5502 scene images, featuring 210 unique fine-grained labels covering a wide range of vehicle types, and is structured under a three-level hierarchical framework. The construction of this dataset entails selecting high-quality images from the IDD detection dataset and performing precise annotation via a professional annotation team. The FGVD dataset finds applications in intelligent traffic monitoring systems, supporting vehicle re-identification and robust detection in dense and occluded traffic scenarios, and addresses the limitations of existing detection models when dealing with complex traffic scenes.

提供机构：

印度理工学院德里分校和海得拉巴国际信息技术研究所

创建时间：

2022-12-30

搜集汇总

数据集介绍

构建方式

在智能交通监控系统日益重要的背景下，精细粒度车辆检测数据集FGVD的构建采用了严谨的流程。该数据集从IDD检测数据集中筛选出5502张高质量的道路场景图像，这些图像由车载移动摄像头在非受控的真实道路环境中捕获，涵盖了复杂的交通状况。标注过程由专业团队执行，采用了两阶段策略：在试点阶段对低密度交通图像进行标注训练，在正式阶段处理高密度、高遮挡的挑战性场景。标注时充分利用了视频序列的时序信息，通过前后帧的标签传播来解决单帧中因遮挡或截断导致的识别困难，并使用外部工具辅助确认，最终通过CVAT工具完成所有边界框和三层层次化标签的标注，确保了数据的可靠性与一致性。

特点

FGVD数据集的核心特点在于其面向真实世界的复杂性与层次化的标签体系。与以往在受控环境下聚焦单一车辆分类的数据集不同，FGVD首次在非受控道路场景中实现了多车辆的精细粒度检测，其图像包含丰富的类内与类间变化，如尺度、姿态、遮挡和光照条件的多样性。数据集包含210个独特的精细粒度标签，并创新性地采用了三层层次结构：车辆类型、制造商和具体型号。尤为突出的是，它首次将精细粒度标注扩展至两轮车、机动三轮车、卡车和公共汽车等类别，而不仅限于轿车，这极大地丰富了研究范畴。数据分布呈现长尾特性，且场景中车辆密集、相互遮挡，使其成为当前最具挑战性的细粒度车辆分析基准之一。

使用方法

该数据集主要服务于计算机视觉领域，特别是精细粒度目标检测与分类任务的研究与评估。典型的使用方法遵循两阶段流程：首先，利用数据集训练或评估目标检测模型（如YOLOv5、Faster R-CNN）以定位图像中的所有车辆并获得其边界框；随后，对裁剪出的车辆区域感兴趣区域，使用精细粒度分类模型（如层次残差网络HRN）进行层次化分类，预测其具体的类型、制造商和型号。研究者可将FGVD作为基准，评估新模型在复杂真实场景下的细粒度检测性能，探索层次化建模、长尾分布学习、以及检测-分类联合优化等方向。此外，其提供的GradCAM++可视化有助于理解模型决策依据，推动可解释性研究。数据集适用于智能交通监控、车辆重识别和高级驾驶辅助系统等相关应用的算法开发。

背景与挑战

背景概述

在计算机视觉领域，细粒度视觉识别旨在区分同一大类下高度相似的子类别，这一任务在智能交通监控、自动驾驶等应用中具有重要价值。然而，现有细粒度数据集多聚焦于分类任务，且通常在受控环境下采集，难以应对真实道路场景中的复杂挑战。为此，印度理工学院德里分校和海得拉巴分校的研究团队于2022年推出了首个面向非约束道路的细粒度车辆检测数据集——FGVD。该数据集通过车载移动摄像头采集，包含5502张场景图像，标注了210个独特的细粒度标签，涵盖汽车、摩托车、滑板车、自动三轮车、卡车和巴士等多种车辆类型，并构建了车型、制造商和型号的三层层次结构。FGVD的推出填补了细粒度检测数据集的空白，为车辆重识别、密集交通场景下的鲁棒检测等研究提供了关键资源，推动了智能交通系统的发展。

当前挑战

FGVD数据集所解决的领域问题——细粒度车辆检测——面临多重挑战。在复杂交通场景中，车辆存在显著的类内与类间差异，包括类型、尺度、姿态、遮挡和光照条件的变化，这些因素使得准确区分高度相似的车辆子类别变得极为困难。现有检测模型如YOLOv5和Faster RCNN因缺乏层次化建模能力，在该数据集上表现不佳。在构建过程中，数据采集与标注同样面临严峻挑战。由于图像来自动态车载摄像头，车辆常处于非中心位置，且背景杂乱、遮挡频繁，导致标注难度大幅增加。此外，数据集中存在长尾分布问题，部分细粒度类别样本稀少，加剧了模型训练的复杂性。这些挑战共同凸显了开发高效层次化检测模型的迫切需求。

常用场景

经典使用场景

在智能交通监控领域，FGVD数据集为细粒度车辆检测任务提供了关键支持。该数据集通过车载摄像头在非约束道路场景中采集，包含5502张图像及210个细粒度标签，涵盖汽车、摩托车、卡车等多种车辆类型的三级层次结构。其经典使用场景在于训练和评估目标检测模型，如YOLOv5与Faster R-CNN，以实现在复杂交通环境中对车辆进行精确的型号、制造商及类型识别。数据集中的图像呈现了遮挡、光照变化及多尺度姿态等挑战，为模型鲁棒性测试提供了真实世界基准。

实际应用

在实际应用中，FGVD数据集可广泛应用于智能交通系统与自动驾驶领域。例如，在城市公共安全监控中，该数据集训练的模型能够实时识别特定车辆型号，辅助执法部门进行车辆追踪与嫌疑车辆排查。在高级驾驶辅助系统中，细粒度检测有助于提升车辆对周围交通参与者的感知精度，增强在拥堵或遮挡场景下的决策可靠性。此外，数据集还可用于交通流量分析，通过车辆类型统计优化道路规划与信号控制，提升城市交通管理效率。

衍生相关工作

FGVD数据集衍生了一系列经典研究工作，主要集中在层次化检测模型的创新上。例如，研究者结合YOLOv5检测器与层次残差网络，通过残差连接传递粗粒度到细粒度的特征知识，显著提升了细粒度分类性能。此外，该数据集激发了针对长尾分布问题的算法探索，如利用标签关系图增强层级相关性建模。这些工作不仅推动了细粒度检测在理论上的进展，也为实际部署中的模型优化提供了新思路，促进了交通视觉领域的技术迭代。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集