Multi-query Re-Identification dataset (MuRI)
收藏arXiv2023-05-25 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2305.15764v1
下载链接
链接失效反馈官方服务:
资源简介:
MuRI数据集是由安徽大学人工智能学院创建的一个大型车辆再识别数据集,包含23637张车辆图像,这些图像由6142个摄像头在真实交通监控系统中捕获。数据集涵盖了多种视角,包括前视、侧视和后视,平均每个车辆ID跨越34.6个摄像头。MuRI数据集旨在为多查询车辆再识别提供一个更真实和具有挑战性的场景,特别是在复杂的监控网络中。此外,数据集的创建考虑了多种环境因素,如光照变化、遮挡和复杂的背景,以确保数据集的多样性和实用性。
The MuRI dataset is a large-scale vehicle re-identification dataset developed by the School of Artificial Intelligence at Anhui University. It includes 23,637 vehicle images captured by 6,142 cameras in real-world traffic surveillance systems. The dataset covers diverse viewpoints including front-view, side-view and rear-view, with each vehicle ID spanning an average of 34.6 cameras. The MuRI dataset aims to provide a more realistic and challenging scenario for multi-query vehicle re-identification, especially in complex surveillance networks. Furthermore, the dataset's development takes into account various environmental factors such as illumination variations, occlusions and complex backgrounds to ensure its diversity and practicality.
提供机构:
安徽大学人工智能学院
创建时间:
2023-05-25
搜集汇总
数据集介绍

构建方式
在智慧城市交通监控的宏大背景下,车辆再识别(Re-ID)技术面临单一查询视角信息有限的瓶颈。为突破这一局限,研究者构建了Multi-query Re-Identification dataset(MuRI)。该数据集依托于覆盖超1000平方千米城市区域的真实交通监控系统,通过公安城市服务平台的海量摄像头(总计6142个)进行数据采集。首先,利用车牌信息在平台上检索对应车辆,随后从交通路口的多方向监控摄像头(如可旋转球机)获取不同视角的图像。为丰富视角多样性,数据集涵盖前视、侧前、侧视、后视及侧后视五种视角,并最终合并为前、侧、后三类。图像经跟踪检测算法生成包围框后,每隔三帧自动选取,再经人工核验以消除冗余。整个采集时间跨度约半年,确保了光照与分辨率的多样性,最终形成包含23637张图像、200个车辆ID的数据集,每个ID平均跨越34.6个摄像头,为多查询车辆Re-ID提供了坚实基准。
特点
MuRI数据集在车辆再识别领域展现出独特优势。其核心特点在于海量摄像头覆盖与丰富视角多样性:6142个摄像头分布于城市广阔区域,每个车辆ID平均被34.6个摄像头捕获,远超现有数据集(如VeRI-776仅20个摄像头),从而真实模拟了跨场景检索的复杂性。数据集提供五种视角(前、侧前、侧、后、侧后),合并为三类后仍保持视角丰富性,有效应对视角变化带来的类内差异。此外,MuRI包含多分辨率图像、遮挡场景、复杂背景及跨时段光照变化(如清晨、午后、夜间),这些挑战性因素全面考验模型在真实环境中的鲁棒性。特别地,数据集专为多查询推理设计,每个车辆ID拥有多个跨场景、跨视角的查询图像,便于利用互补信息提升识别精度,同时支持评估模型在缺失视角下的恢复能力。
使用方法
MuRI数据集专为多查询车辆Re-ID任务设计,使用方法体现其创新性。在训练阶段,通常采用150个ID作为训练集,剩余50个ID用于测试。推理时,将整个测试集作为画廊(gallery),而查询(query)则从每个测试ID中随机选取三张不同视角(前、侧、后)的图像构成多查询集。评估方法支持三种推理方式:单查询直接计算查询与画廊的余弦距离;平均查询对多查询特征取均值;多查询则通过视角条件网络(VCNet)中的视角自适应融合(VAF)模块,根据查询与画廊的视角相似度动态分配权重,融合特征后计算相似度。此外,针对查询集可能缺失视角的情况,可启用跨视角特征恢复(CVFR)模块补全缺失特征。性能评估采用传统指标(如Rank1、mAP)与新提出的平均跨场景精度(mCSP),后者通过抑制同摄像头相似视角的正样本,更准确衡量跨场景检索能力。
背景与挑战
背景概述
车辆再识别(Vehicle Re-ID)作为智能交通与城市安防的关键技术,旨在跨非重叠摄像头关联同一车辆图像。传统方法多依赖单张查询图像,但视角剧烈变化导致类内差异巨大,严重制约性能。为突破此瓶颈,安徽大学郑爱华团队联合科大讯飞于2023年提出多查询车辆再识别(Multi-query Vehicle Re-ID)任务,并创建统一基准数据集MuRI。该数据集由6142个真实交通监控摄像头采集,涵盖200个车辆身份、五类视角(前、侧前、侧、后、侧后),每辆车平均跨越34.6个场景,提供丰富跨视角与跨场景信息,为车辆Re-ID研究开辟新方向。MuRI的发布填补了多查询场景下大规模、多视角、高复杂度数据集的空白,显著推动领域从单一视角向多源信息融合的演进。
当前挑战
MuRI数据集面临的挑战多维交织。领域层面,车辆视角多样性导致的类内差异是核心难题,传统单查询方法难以匹配跨视角图像,而多查询虽能互补信息,但如何自适应融合不同视角特征并处理缺失视角成为关键。构建过程中,数据采集需在超1000平方公里的城市监控网络中通过车牌关联车辆,仅选取交通路口多方向球型摄像头确保视角丰富性,涉及数十万摄像头筛选与长跨度(半年)时间覆盖。此外,跨分辨率、遮挡、复杂背景及光照剧变(如夜间车灯强光)进一步加剧识别难度,现有评估指标(如mAP)易受同摄像头相似视角正样本干扰,需设计新度量(如mCSP)以真实反映跨场景检索能力。
常用场景
经典使用场景
在城市交通监控的复杂网络环境下,车辆重识别任务常受限于单张查询图像视角单一、信息匮乏的困境。MuRI数据集专为多查询车辆重识别设计,其经典使用场景在于利用同一车辆从不同视角或场景获取的多张图像作为联合查询,通过整合互补的视角信息,显著提升跨摄像头、跨场景的车辆匹配精度。该数据集包含由6142个真实监控摄像头采集的丰富图像,每辆车平均跨越34.6个摄像头,并涵盖前、侧、后等多种视角,为评估多源信息融合下的重识别算法提供了统一且极具挑战性的基准。
衍生相关工作
基于MuRI数据集,衍生了一系列具有影响力的经典工作,其中最具代表性的是与之同步提出的视角条件网络(VCNet)。VCNet创新性地设计了视角条件编码模块,将车辆视角特征嵌入外观特征学习过程,并引入基于视角的自适应融合模块,在推理阶段依据查询与图库图像的视角相似度动态分配权重,有效整合多视角互补信息。此外,针对查询视角缺失的实际情况,跨视角特征恢复模块通过对比学习与双预测机制重构缺失特征,增强了模型的鲁棒性。这些工作不仅推动了多查询车辆重识别任务的发展,也为后续研究者在多模态融合、条件特征学习等领域提供了重要的方法论参考。
数据集最近研究
最新研究方向
在智能交通与城市安全监控领域,车辆再识别(Re-ID)技术正从传统的单查询范式向多查询范式演进。最新研究聚焦于如何利用多视角、多场景的车辆图像作为查询,以克服单一视角带来的外观歧义性。MuRI数据集应运而生,它由6142个真实交通监控摄像头采集,涵盖200个车辆身份、丰富的五类视角及每辆车平均跨越34.6个场景的独特特性,为多查询车辆Re-ID提供了前所未有的基准。该数据集推动了基于视角条件网络(VCNet)的研究,通过视角条件编码、自适应融合与跨视角特征恢复模块,显著提升了跨场景检索的鲁棒性。同时,新提出的平均跨场景精度(mCSP)指标更精准地评估了模型在真实监控网络中的泛化能力,与当前智慧城市中大规模轨迹追踪、跨摄像头协同分析等热点需求紧密契合,对推动智能安防系统从实验室走向大规模部署具有关键意义。
相关研究论文
- 1Multi-query Vehicle Re-identification: Viewpoint-conditioned Network, Unified Dataset and New Metric安徽大学人工智能学院 · 2023年
以上内容由遇见数据集搜集并总结生成



