five

MVB

收藏
arXiv2019-07-26 更新2024-06-21 收录
下载链接:
http://volumenet.cn/
下载链接
链接失效反馈
官方服务:
资源简介:
MVB数据集是由同方威视人工智能研发中心创建的,旨在解决机场行李安全检查中的再识别问题。该数据集包含4519个行李身份,总计22660个图像,每个行李身份至少有两张图像,分别在行李处理系统(BHS)和海关检查点拍摄。数据集通过专门设计的多视角相机系统捕捉,以尽可能完整地获取行李表面的三维信息。MVB数据集的创建过程涉及在机场实际环境中收集图像,并通过人工标注进行图像的分割和识别。该数据集的应用领域主要集中在提高行李安全检查的效率和准确性,通过深度学习方法实现行李的自动识别和分类。

The MVB Dataset was developed by the AI R&D Center of Tsinghua Tongfang Security Technology Co., Ltd., with the goal of addressing the re-identification problem in airport baggage security screening. This dataset encompasses 4,519 baggage identities and a total of 22,660 images, where each baggage identity has at least two images captured separately in the Baggage Handling System (BHS) and at the customs inspection checkpoint. The dataset is collected via a specially designed multi-view camera system to comprehensively acquire three-dimensional information of the baggage surface as thoroughly as possible. The creation of the MVB Dataset involves collecting images in real-world airport environments and performing manual annotation for image segmentation and recognition. The main application fields of this dataset focus on improving the efficiency and accuracy of baggage security screening, enabling automatic identification and classification of baggage through deep learning methods.
提供机构:
同方威视人工智能研发中心
创建时间:
2019-07-26
搜集汇总
数据集介绍
main_image_url
构建方式
在行李再识别研究领域,MVB数据集的构建体现了对现实场景复杂性的深刻把握。该数据集通过专门设计的多视角摄像系统,在国际机场的真实环境中采集数据。系统分为行李处理系统和海关检查点两个阶段:前者在传送带入口处部署三台摄像机,从右前、顶部和左后三个角度同步捕捉图像;后者在检查通道内嵌入四台摄像机,针对乘客不同行进方向和行为模式进行图像采集。数据标注过程采用两阶段匹配策略,首先基于时间戳耦合同一场景下的多视角图像,随后通过预训练模型辅助人工确认跨场景的行李身份对应关系,最终形成包含4519个独立身份、22660张标注图像的完整数据集。
特点
MVB数据集展现出三个维度的显著特征。其规模性体现在涵盖4519个行李身份和22660张标注图像,每个身份均包含行李处理系统和检查点的跨场景图像对。多视角特性通过七台摄像机的协同工作,最大程度获取行李表面的三维信息,有效缓解姿态变化和遮挡问题。最具挑战性的是其显著的类间相似性与类内差异性:许多行李箱外观高度相似,而同一行李在不同场景下的图像因光照、背景、运动模糊等因素产生巨大差异,形成天然的跨域识别问题。数据集还额外提供表面材质标签和手工绘制的掩码标注,为细粒度分析提供支持。
使用方法
该数据集的使用遵循行李再识别任务的标准范式,但针对应用场景进行了专门设计。研究任务定义为跨域检索问题:将以检查点图像作为查询样本,在行李处理系统图像库中进行身份匹配。数据集按身份随机划分为4019个训练身份和500个测试身份,测试集包含1052个查询样本和1432个库样本。评估采用累积匹配特性指标,重点关注前三位匹配准确率。使用过程中需注意每个身份的多张库图像应作为整体处理,通过计算查询样本与同一身份多张图像的平均相似度来确定最终排序。基线方法采用融合孪生网络架构,通过特征图逐元素减法和通道注意力机制增强判别能力。
背景与挑战
背景概述
在计算机视觉领域,行李再识别(Baggage ReID)作为一项新兴任务,旨在通过外观图像跨摄像头追踪行李,以提升机场安检效率。2019年,由同方威视人工智能研发中心的研究团队发布了首个大规模公开数据集MVB(Multi View Baggage),该数据集包含4519个行李身份和22660张标注图像,并首次引入多视角采集系统以应对姿态变化与遮挡问题。MVB的构建聚焦于解决行李在行李处理系统与海关检查点之间的跨域匹配挑战,其数据源自真实机场环境,显著推动了行李再识别从实验室研究向工业应用的转化,为通用物体再识别任务提供了重要基准。
当前挑战
MVB数据集所针对的行李再识别任务面临多重挑战:行李外观相似度高导致类间区分困难,且跨域场景下存在显著的类内差异,如背景杂乱、光照变化、运动模糊及严重遮挡等问题。在数据集构建过程中,研究团队需克服多视角图像同步采集的技术难题,确保行李表面三维信息的完整性;同时,数据标注面临身份匹配的复杂性,需通过人工与模型协同方式在大量图像中精确关联同一行李的不同视角,并处理因乘客行为导致的图像无效或缺失情况,这些因素共同增加了数据集构建的复杂度与可靠性要求。
常用场景
经典使用场景
在计算机视觉领域,行李重识别任务面临着独特的挑战,MVB数据集为此提供了经典的研究平台。该数据集最核心的应用场景在于模拟真实机场环境中行李从行李处理系统到海关检查点的跨域检索过程,通过多视角图像采集系统捕捉行李在不同光照、姿态和背景下的外观变化,为算法提供了处理类间相似性与类内差异性的复杂测试环境。其精心设计的采集流程与标注体系,使得研究者能够系统评估模型在应对遮挡、运动模糊和视角变换等实际困难时的鲁棒性,成为推动行李重识别技术从理论走向实践的关键基础设施。
实际应用
MVB数据集直接服务于智慧机场与海关安检的实际需求。其设计的核心应用场景是替代或辅助传统的RFID标签检测系统,实现无接触、自动化的行李追踪与风险管控。在行李处理系统端,多摄像头捕获行李外观并与X光安检信息绑定;在旅客通关时,再次捕获行李图像并进行实时匹配,从而精准识别需开箱检查的行李。这一流程可显著降低因标签脱落或金属干扰导致的漏检风险,提升通关效率与安全性。数据集所训练的模型,能够适应复杂的现场光照、旅客遮挡和行李姿态变化,为构建稳定可靠的自动化安检流水线提供了关键技术验证基础。
衍生相关工作
自MVB数据集发布以来,已衍生出多个具有影响力的研究方向与改进工作。在模型架构方面,其提出的融合孪生网络基线启发了后续研究,许多工作在此基础上引入更强大的注意力机制、图神经网络或度量学习策略,以更好地处理行李的局部细节与跨域差异。数据集的多视角特性催生了基于三维表面重建或视角不变特征的学习方法,将行李重识别拓展至三维对象检索范畴。此外,其跨域特性促使研究者探索无监督域适应、生成对抗网络等迁移学习技术在行李场景的应用。一些工作还利用其材质标签发展多任务学习框架,同时优化重识别与属性识别性能。这些衍生工作共同推动了通用物体重识别技术体系的完善。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作