five

VeRi776, VehicleID, VERI-Wild, VRAI, N-CARS, PKU-VD|车辆识别数据集|图像处理数据集

收藏
github2023-10-12 更新2024-05-31 收录
车辆识别
图像处理
下载链接:
https://github.com/muzishen/awesome-vehicle_reid-dataset
下载链接
链接失效反馈
资源简介:
VeRi776包含超过50,000张776辆车的图像,这些图像由20台摄像机拍摄,在24小时内覆盖1.0平方公里的面积,这使得该数据集可扩展到足以用于车辆Re-Id和其他相关研究。 VehicleID包含白天在中国一个小城市中分布的多个真实监控摄像头捕获的数据。 整个数据集中共有26267辆车(共221763张图像)。 每个图像都带有一个与现实世界中的身份相对应的id标签。 此外,我们手动标记了10319辆车辆(共90196张图像)的车辆型号信息。 VERI-Wild车辆图像由一个包含174个摄像机,拍摄范围覆盖超过200平方公里的市区CCTV系统拍摄。摄像机是24小时连续拍摄30天,其长时间的连续拍摄考虑了车辆真实的各种天气和光照问题。包含了40万张图片,4万种车辆标签。该数据集提供了摄像机ID,时间戳,摄像机之间的跟踪关系。 VRAI使用无人机上的摄像头进行拍摄车辆图像,该数据集包含了137613张图像,包括13022中车辆类别,为了增加车内差异,每辆车至少有两个无人机在不同位置,不同视角和飞行高度(15m至80m)进行拍摄,同时作者手动标记了各种车辆的属性,包括车辆的类别、颜色、天窗、保险杠、备用轮胎和行李架。同时,对于每个车辆图像,还注释标记有差异的部分,用来将特定车辆与其他车辆进行区分。 N-CARS该数据集是基于现实事件的数据集,它由从市区和高速公路环境中的汽车驾驶中获取的约24000个样本组成。用安装在汽车挡风玻璃后面的ATIS摄像机拍摄了80分钟,并将其转换为常规的灰度图像,并标记样本。该数据集有12336个汽车样本和11693非汽车样本组成的两类数据集。其中训练集分为7940个汽车和7482个背景样本,测试集包含4396个汽车样本和4211个背景测试样本。 PKU-VD该数据集包含了两个大型车辆数据集(VD1和VD2),它们分别从两个城市的真实世界不受限制的场景拍摄图像。其中VD1是从高分辨率交通摄像头获得的,VD2中的图像则是从监视视频中获取的。作者对原始数据执行车辆检测,以确保每个图像仅包含一辆车辆。由于隐私保护的限制,所有车牌号码都已被黑色覆盖遮挡。所有车辆图像均从前视图进行拍摄。

The VeRi776 dataset comprises over 50,000 images of 776 vehicles, captured by 20 cameras covering an area of 1.0 square kilometers over a 24-hour period, making this dataset sufficiently scalable for vehicle Re-Id and other related research. The VehicleID dataset includes data captured by multiple real surveillance cameras distributed in a small Chinese city during the day. The entire dataset contains 26,267 vehicles (221,763 images in total). Each image is tagged with an ID corresponding to a real-world identity. Additionally, we have manually labeled the vehicle model information for 10,319 vehicles (90,196 images in total). The VERI-Wild vehicle images were captured by a CCTV system consisting of 174 cameras covering an urban area of over 200 square kilometers. The cameras operated continuously for 30 days, 24 hours a day, considering various weather and lighting conditions for realistic vehicle scenarios. It includes 400,000 images with 40,000 vehicle labels. The dataset provides camera IDs, timestamps, and tracking relationships between cameras. The VRAI dataset uses cameras mounted on drones to capture vehicle images, containing 137,613 images across 13,022 vehicle categories. To increase intra-vehicle variation, each vehicle was captured by at least two drones at different positions, angles, and flight heights (15m to 80m). The authors manually labeled various vehicle attributes, including vehicle type, color, sunroof, bumper, spare tire, and roof rack. Additionally, for each vehicle image, annotated differences are marked to distinguish specific vehicles from others. The N-CARS dataset is based on real events, consisting of approximately 24,000 samples obtained from car driving in urban and highway environments. The samples were captured by an ATIS camera installed behind the car windshield for 80 minutes, converted into regular grayscale images, and labeled. The dataset is divided into two categories: 12,336 car samples and 11,693 non-car samples. The training set includes 7,940 car samples and 7,482 background samples, while the test set contains 4,396 car samples and 4,211 background test samples. The PKU-VD dataset includes two large vehicle datasets (VD1 and VD2), captured from unrestricted real-world scenarios in two cities. VD1 images were obtained from high-resolution traffic cameras, while VD2 images were captured from surveillance videos. The authors performed vehicle detection on the original data to ensure each image contains only one vehicle. Due to privacy protection, all license plate numbers have been obscured with black covers. All vehicle images were captured from the front view.
创建时间:
2019-12-11
原始信息汇总

数据集概述

1. VeRi776

  • 数据库名称:VeRi776
  • 数据库描述:包含超过50,000张776辆车的图像,由20台摄像机在24小时内拍摄,覆盖1.0平方公里。图像在真实世界的无约束监视场景中捕获,并标有不同的属性,如BBox、类型、颜色和品牌。
  • 下载地址链接

2. VehicleID

  • 数据库名称:VehicleID
  • 数据库描述:包含26267辆车(共221763张图像),图像在白天由多个真实监控摄像头在中国一个小城市中捕获。每个图像都带有一个与现实世界中的身份相对应的id标签。
  • 下载地址链接

3. VERI-Wild

  • 数据库名称:VERI-Wild
  • 数据库描述:包含40万张图片,4万种车辆标签,由174个摄像机在超过200平方公里的市区CCTV系统拍摄,考虑了车辆在各种天气和光照条件下的真实情况。
  • 项目地址链接
  • 下载地址链接 密码:kob9

4. VRAI

  • 数据库名称:VRAI
  • 数据库描述:包含137613张图像,13022种车辆类别,使用无人机上的摄像头进行拍摄,每辆车至少有两个无人机在不同位置、视角和飞行高度(15m至80m)进行拍摄。
  • 提交者联系方式:bingliang.jiao@mail.nwpu.edu.cn

5. N-CARS

  • 数据库名称:N-CARS
  • 数据库描述:基于现实事件的数据集,由约24000个样本组成,从市区和高速公路环境中的汽车驾驶中获取,用安装在汽车挡风玻璃后面的ATIS摄像机拍摄。
  • 下载地址链接

6. PKU-VD

  • 数据库名称:PKU-VD
  • 数据库描述:包含两个大型车辆数据集(VD1和VD2),分别从两个城市的真实世界不受限制的场景拍摄图像。VD1从高分辨率交通摄像头获得,VD2从监视视频中获取。
  • 数据库链接链接
  • 下载链接:填写协议,后下载

7. 百度阿波罗3D汽车数据集

  • 数据库名称:百度阿波罗3D汽车数据集
  • 数据库描述:数据集中包含相机固有参数、汽车模型集、汽车位置标记、汽车图像及训练和验证图像的索引。
  • 下载地址链接

8. Cars Dataset

  • 数据库名称:Cars Dataset
  • 数据库描述:包含196种汽车的16,185张图像,数据分割为8,144张训练图像和8,041张测试图像。
  • 项目链接链接
  • 训练数据链接
  • 测试数据链接

9. CompCars

  • 数据库名称:CompCars
  • 数据库描述:包含来自网络和监视的两个途径的图像,网络图像包含163种车辆品牌,1,716种车型,共有136,726张整个汽车的图像,27,618张汽车零件图像。
  • 项目连接链接
  • 下载链接:填写承诺书,然后发邮件,获取下载链接

10. BIT -Vehicle

  • 数据库名称:BIT -Vehicle
  • 数据库描述:包含9580个车辆图像和6种车型:轿车、运动型多用途车(SUV)、小型客车、卡车、公共汽车和小型货车。
  • 下载地址链接 密码:29cf

11. VehicleGrouping

  • 数据库名称:VehicleGrouping
  • 数据库描述:包含大约140万张图片,用于车辆的细粒度识别以及包括比例尺在内的摄像头校准。
  • 项目网址链接

12. BoxCars116k

  • 数据库名称:BoxCars116k
  • 数据库描述:由多个监控摄像头从各个角度拍摄116K车辆图像。
  • 项目网址链接
AI搜集汇总
数据集介绍
main_image_url
构建方式
VeRi776数据集通过在真实世界的无约束监控场景中,利用20台摄像机在24小时内覆盖1.0平方公里的区域,捕捉了超过50,000张图像,涵盖776辆车的多角度、多光照、多遮挡条件下的图像。每辆车由2至18台摄像机拍摄,确保了图像的多样性和复杂性。此外,数据集还标注了车辆的属性,如BBox、类型、颜色和品牌,以及时空信息,如车牌的BBox、时间戳和相邻摄像机之间的距离,为车辆重识别研究提供了丰富的数据支持。
特点
VeRi776数据集的显著特点在于其高度的真实性和多样性。数据集不仅包含了车辆在不同视角、光照条件和遮挡情况下的图像,还提供了详细的车辆属性和时空信息,使得研究者能够训练和评估复杂的车辆重识别模型。此外,数据集的规模和覆盖范围使其成为车辆重识别领域的重要基准,适用于多种相关研究。
使用方法
VeRi776数据集适用于车辆重识别、图像识别和计算机视觉领域的研究。研究者可以通过下载数据集,利用标注的车辆属性信息进行模型训练和测试。数据集的多样性和详细标注使其适合用于开发和验证新的车辆重识别算法。使用时,建议参考原始许可证,并根据研究需求选择合适的图像和标注信息进行实验。
背景与挑战
背景概述
车辆再识别(Vehicle Re-Identification, Re-Id)是计算机视觉领域中一个备受关注的研究方向,尤其在城市监控和智能交通系统中具有重要应用价值。近年来,随着深度学习技术的快速发展,车辆再识别技术得到了显著提升,而这一进步离不开大规模、高质量的车辆数据集的支持。VeRi776、VehicleID、VERI-Wild、VRAI、N-CARS、PKU-VD等数据集的创建,为车辆再识别算法的研究提供了丰富的资源。这些数据集涵盖了从城市监控摄像头到无人机拍摄的多种场景,包含了车辆的多角度、多光照、多遮挡等复杂情况,极大地推动了车辆再识别技术的发展。例如,VeRi776数据集包含了超过50,000张图像,覆盖了776辆车的不同视角和属性,为车辆再识别模型的训练和评估提供了坚实的基础。
当前挑战
尽管这些车辆再识别数据集为研究提供了宝贵的资源,但在构建和应用过程中仍面临诸多挑战。首先,数据集的多样性和复杂性带来了标注和处理的困难,尤其是在多摄像头、多视角、多光照条件下,车辆的外观变化极大,导致标注的准确性和一致性难以保证。其次,车辆再识别任务中,遮挡、视角变化、光照变化等问题仍然未得到完全解决,这些因素对模型的鲁棒性提出了更高的要求。此外,数据集的规模和覆盖范围也限制了算法的泛化能力,尤其是在面对新场景或新车型时,模型的表现往往不尽如人意。最后,数据集的隐私问题和伦理问题也值得关注,如何在保护隐私的前提下,充分利用数据集进行研究,是一个亟待解决的难题。
常用场景
经典使用场景
在车辆重识别(Vehicle Re-Identification, Re-ID)领域,VeRi776、VehicleID、VERI-Wild等数据集的经典使用场景主要集中在城市监控系统中的车辆识别与追踪。这些数据集通过提供多视角、多光照条件下的车辆图像,支持研究人员开发和验证车辆重识别算法。例如,VeRi776数据集通过20台摄像机在24小时内拍摄的50,000多张图像,为车辆Re-ID提供了丰富的时空信息和多样化的车辆属性标注,使得算法能够在复杂的监控环境中有效识别和追踪车辆。
衍生相关工作
基于这些数据集,研究人员开发了多种车辆重识别算法和模型,推动了该领域的技术进步。例如,基于VeRi776数据集的研究工作提出了多种深度学习模型,用于提高车辆重识别的准确性和鲁棒性。VERI-Wild数据集则激发了大规模车辆重识别算法的研究,如多摄像头协同追踪和跨时空车辆识别。此外,这些数据集还促进了车辆属性识别、车辆型号分类等相关研究,为智能交通和城市安全领域提供了重要的技术支持。
数据集最近研究
最新研究方向
在车辆再识别(Vehicle Re-Identification, Re-ID)领域,最新的研究方向主要集中在提升模型在复杂环境下的鲁棒性和识别精度。随着城市监控系统的普及和无人机技术的应用,研究者们越来越关注如何在多视角、多光照条件、不同天气和遮挡情况下实现高效的车辆识别。例如,VERI-Wild数据集通过大规模的市区监控视频,提供了丰富的车辆图像和时空信息,推动了车辆Re-ID在实际应用中的性能提升。此外,VRAI数据集利用无人机拍摄的高空图像,探索了车辆在空中视角下的识别问题,为车辆Re-ID在多模态数据融合方面提供了新的研究思路。这些研究不仅提升了车辆识别的准确性,还为智能交通系统和城市安全管理提供了技术支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

ANC

美国国家语料库(American National Corpus,简称ANC)是一个大规模的电子美国英语语料库,包含多种类型文本及口语数据转录,旨在全面反映美国英语的多样性。其开放部分OANC约有1500万字,涵盖多种文体,且进行了自动标注。

anc.org 收录

AIS数据集

该研究使用了多个公开的AIS数据集,这些数据集经过过滤、清理和统计分析。数据集涵盖了多种类型的船舶,并提供了关于船舶位置、速度和航向的关键信息。数据集包括来自19,185艘船舶的AIS消息,总计约6.4亿条记录。

github 收录

中国1km分辨率逐月平均气温数据集(1901-2024)

该数据为中国逐月平均温度数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2024.12。数据格式为NETCDF,即.nc格式。数据单位为0.1 ℃。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

YOLO-dataset

该数据集用于训练YOLO模型,包括分类、检测和姿态识别模型。目前支持v8版本,未来计划支持更多版本。

github 收录

THCHS-30

“THCHS30是由清华大学语音与语言技术中心(CSLT)发布的开放式汉语语音数据库。原始录音是2002年在清华大学国家重点实验室的朱晓燕教授的指导下,由王东完成的。清华大学计算机科学系智能与系统,原名“TCMSD”,意思是“清华连续普通话语音数据库”,时隔13年出版,由王东博士发起,并得到了教授的支持。朱小燕。我们希望为语音识别领域的新研究人员提供一个玩具数据库。因此,该数据库对学术用户完全免费。整个软件包包含建立中文语音识别所需的全套语音和语言资源系统。”

OpenDataLab 收录