five

VeRi|车辆再识别数据集|监控技术数据集

收藏
github2020-04-06 更新2024-05-31 收录
车辆再识别
监控技术
下载链接:
https://github.com/Xun-Yang/VeRidataset
下载链接
链接失效反馈
资源简介:
VeRi数据集是一个用于车辆再识别的大型基准数据集,包含超过50,000张776辆车辆的图像,这些图像由20个摄像头在24小时内覆盖1.0平方公里的区域拍摄。数据集在真实世界的非约束监控场景中捕获,并标注了多种属性,如边界框、类型、颜色和品牌,支持复杂模型的学习和评估。每辆车由2到18个不同视角、光照、分辨率和遮挡的摄像头捕获,提供了高重复率,适用于实际监控环境中的车辆再识别。此外,数据集还标注了足够的牌照和时空信息,如牌照边界框、牌照字符串、车辆时间戳以及相邻摄像头之间的距离。

The VeRi dataset is a large-scale benchmark dataset for vehicle re-identification, comprising over 50,000 images of 776 vehicles captured by 20 cameras over a 24-hour period covering an area of 1.0 square kilometers. The dataset is captured in real-world, unconstrained surveillance scenarios and annotated with multiple attributes such as bounding boxes, type, color, and brand, supporting the learning and evaluation of complex models. Each vehicle is captured by 2 to 18 cameras with varying perspectives, lighting conditions, resolutions, and occlusions, providing a high repetition rate suitable for vehicle re-identification in practical surveillance environments. Additionally, the dataset is annotated with sufficient license plate and spatio-temporal information, including license plate bounding boxes, license plate strings, vehicle timestamps, and distances between adjacent cameras.
创建时间:
2017-09-13
原始信息汇总

VeRi数据集概述

数据集特性

  • 规模与覆盖范围:包含超过50,000张图像,涉及776辆车,由20个摄像头在1.0平方公里的区域内24小时内拍摄。
  • 图像属性:图像在真实世界的非受控监控场景中捕捉,标注了多种属性,包括边界框(BBoxes)、类型、颜色和品牌。
  • 车辆视角与环境:每辆车由2至18个不同视角、光照、分辨率和遮挡情况的摄像头捕捉,提供了高重复率。
  • 标注信息:数据集还标注了足够的牌照和时空信息,如牌照框、牌照字符串、车辆时间戳以及相邻摄像头间的距离。

数据集下载

  • 获取方式:数据集正在修订中,需通过电子邮件向联系人(xinchenliu at bupt dot edu dot cn)提供全名和单位信息以请求获取,确保数据用于非商业目的。

数据集问题

  • 标注错误:先前版本的训练集标签文件(train_label.xml)中,车辆3、7和41被错误标注为类型ID="0",与合法类型列表不符。

引用信息

  • 参考文献:使用此数据集时,请引用以下论文:
    • Liu X., Liu W., Ma H., Fu H.: Large-scale vehicle re-identification in urban surveillance videos. In: IEEE International Conference on Multimedia and Expo. (2016) accepted.
    • Liu X., Liu W., Mei T., Ma H. A Deep Learning-Based Approach to Progressive Vehicle Re-identification for Urban Surveillance. In: European Conference on Computer Vision. Springer International Publishing, 2016: 869-884.
AI搜集汇总
数据集介绍
main_image_url
构建方式
VeRi数据集的构建旨在推动车辆重识别(Re-Id)领域的研究。该数据集通过在现实世界的城市监控场景中,利用20台摄像头在24小时内对一个1.0平方公里区域进行拍摄,收集了超过50,000张776辆车的图像,实现了数据集的可扩展性,为车辆Re-Id及相关研究提供了丰富的数据资源。
特点
VeRi数据集的特点体现在其真实世界的无约束监控场景中捕获的图像,并带有多种属性标注,如边界框、车型、颜色和品牌等。数据集中每辆车从不同视角、光照、分辨率和遮挡中被2到18台摄像头捕获,为车辆Re-Id在真实监控环境中的高重现率提供了条件。此外,数据集还包含了充足的牌照和时空信息标注。
使用方法
使用VeRi数据集需先通过邮件向提供者索取,确保数据仅用于非商业研究目的。在使用数据集时,需关注数据集中可能存在的标注错误,并在引用时遵循指定的论文引用格式。数据集的使用包括计算查询图像和测试图像的距离矩阵、读取地面真实情况和无效图像索引,并通过排序和计算平均精度来评估车辆搜索效果。
背景与挑战
背景概述
VeRi数据集,作为车辆重识别(Re-Id)领域的重要基准,由Liu X.等研究人员构建,旨在为现实世界城市监控场景提供大规模的车辆重识别数据集。该数据集成立于2016年,并迅速成为相关研究的重要资源。VeRi数据集涵盖了776辆车的50,000多张图片,这些图片由20台相机在24小时内拍摄,覆盖了1.0平方公里区域,其规模足以支撑车辆Re-Id及其他相关研究。数据集中的图像在真实无约束的监控场景中捕获,并标注有各种属性,如边界框、车型、颜色和品牌,为复杂模型的训练和评估提供了条件。此外,VeRi还标注有足够的车牌和时空信息,进一步丰富数据集的实用性。
当前挑战
VeRi数据集面临的挑战主要涉及两个方面:一是领域问题层面的挑战,即如何在多视角、光照变化、分辨率差异及遮挡等复杂情况下,准确进行车辆重识别;二是数据集构建过程中的挑战,例如保证数据质量、处理数据标注错误、以及确保数据仅用于非商业研究目的。前版本的VeRi数据集在train_label.xml文件中存在标注错误,需要修订以保证数据的准确性。同时,数据集的获取和使用也需严格控制,以保护数据隐私和版权。
常用场景
经典使用场景
VeRi数据集作为车辆重识别领域的重要基准,其经典使用场景主要在于为车辆重识别算法提供大规模、多样化的现实监控图像。该数据集包含了50,000余张车辆图片,覆盖了776辆车,由20个摄像头在24小时内捕捉,满足了车辆重识别及其他相关研究对于数据规模的需求。
解决学术问题
VeRi数据集解决了车辆重识别研究中图像视角变化、光照条件、分辨率以及遮挡等实际监控环境中的复杂问题。通过提供丰富的车辆属性标注和时空信息,VeRi使得研究者能够训练并评估更加复杂的模型,从而推动了车辆重识别技术的进步。
衍生相关工作
基于VeRi数据集,研究者已经开展了一系列相关工作,包括但不限于深度学习在车辆重识别中的应用、车辆属性的细粒度识别以及大规模车辆重识别系统的构建等,这些工作进一步扩展了VeRi数据集的应用范围和影响力。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

NIST Thermochemical Database

NIST Thermochemical Database(NIST热化学数据库)是一个包含大量热化学数据的数据集,涵盖了各种化学物质的热力学性质,如焓、熵、自由能等。该数据库由美国国家标准与技术研究院(NIST)维护,旨在为科学研究和工业应用提供准确的热化学数据。

webbook.nist.gov 收录

FlowBench

FlowBench是由爱荷华州立大学创建的一个大规模流体模拟数据集,包含超过10,000个样本,旨在评估神经PDE求解器在复杂几何形状上的性能。数据集涵盖了多种复杂几何形状(参数化和非参数化)和流体条件(雷诺数和格拉晓夫数),捕捉了从稳态到瞬态的各种流体现象。每个样本都包含速度、压力和温度场的数据,以及升力、阻力和努塞尔数等工程特征。FlowBench的创建过程包括使用高保真模拟器进行直接数值模拟,确保数据的准确性和可靠性。该数据集主要应用于工程领域,如航空航天、汽车设计和生物流体学,旨在解决复杂几何形状上的流体动力学问题。

arXiv 收录

The MaizeGDB

The MaizeGDB(Maize Genetics and Genomics Database)是一个专门为玉米(Zea mays)基因组学研究提供数据和工具的在线资源。该数据库包含了玉米的基因组序列、基因注释、遗传图谱、突变体信息、表达数据、以及与玉米相关的文献和研究工具。MaizeGDB旨在支持玉米遗传学和基因组学的研究,为科学家提供了一个集成的平台来访问和分析玉米的遗传和基因组数据。

www.maizegdb.org 收录

THCHS-30

“THCHS30是由清华大学语音与语言技术中心(CSLT)发布的开放式汉语语音数据库。原始录音是2002年在清华大学国家重点实验室的朱晓燕教授的指导下,由王东完成的。清华大学计算机科学系智能与系统,原名“TCMSD”,意思是“清华连续普通话语音数据库”,时隔13年出版,由王东博士发起,并得到了教授的支持。朱小燕。我们希望为语音识别领域的新研究人员提供一个玩具数据库。因此,该数据库对学术用户完全免费。整个软件包包含建立中文语音识别所需的全套语音和语言资源系统。”

OpenDataLab 收录