five

VIPeR, ETH1,2,3, QMUL iLIDS, GRID, CAVIAR4ReID, 3DPeS, PRID2011, V47, WARD, SAIVT-Softbio, CUHK01, CUHK02, CUHK03, RAiD

收藏
github2020-05-17 更新2024-05-31 收录
下载链接:
https://github.com/zhengkang86/awesome-reid-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个收集公共可用的人物再识别数据集的仓库,包含多个数据集的详细信息,如发布时间、身份数量、摄像头数量、图像数量等。

This repository aggregates publicly available datasets for person re-identification, encompassing detailed information on multiple datasets such as release dates, the number of identities, the number of cameras, and the number of images.
创建时间:
2019-07-05
原始信息汇总

数据集概述

数据集列表

数据集 发布时间 身份数量 摄像头数量 图像数量 标签方法 裁剪尺寸 多镜头 跟踪序列 全帧可用性
VIPeR 2007 632 2 1264 手工 128X48
ETH1,2,3 2007 85, 35, 28 1 8580 手工 变化
QMUL iLIDS 2009 119 2 476 手工 变化
GRID 2009 1025 8 1275 手工 变化
CAVIAR4ReID 2011 72 2 1220 手工 变化
3DPeS 2011 192 8 1011 手工 变化 ✔*
PRID2011 2011 934 2 24541 手工 128X64 ✔*
V47 2011 47 2 752 手工 变化
WARD 2012 70 3 4786 手工 128X48
SAIVT-Softbio 2012 152 8 64472 手工 变化
CUHK01 2012 971 2 3884 手工 160X60
CUHK02 2013 1816 10(5 pairs) 7264 手工 160X60
CUHK03 2014 1467 10(5 pairs) 13164 手工/DPM 变化
RAiD 2014 43 4 6920 手工 128X64
iLIDS-VID 2014 300 2 42495 手工 变化
MPR Drone 2014 84 1 金字塔特征(ACF) 变化
HDA Person Dataset 2014 53 13 2976 手工/金字塔特征(ACF) 变化
Shinpuhkan Dataset 2014 24 16 手工 128X48
CASIA Gait Database B 2015(*see below) 124 11 背景减除 变化
Market1501 2015 1501 6 32217 手工/DPM 128X64
PKU-Reid 2016 114 2 1824 手工 128X64
PRW 2016 932 6 34304 手工 变化
Large scale person search 2016 11934s - 34574 手工 变化
MARS 2016 1261 6 1191003 DPM+GMMCP 256X128
DukeMTMC-reID 2017 1812 8 36441 手工 变化
DukeMTMC4ReID 2017 1852 8 46261 Doppia 变化
Airport 2017 9651 6 39902 ACF 128X64
MSMT17 2018 4101 15 126441 Faster RCNN 变化
RPIfield 2018 112 12 601,581 ACF 变化

数据集详细信息

VIPeR

  • 描述: 包含两个摄像头,每个摄像头捕捉一个人的图像,提供视角角度。
  • 特点: 尽管经过多次测试,仍是最具挑战性的数据集之一。

ETH1,2,3

  • 描述: 与其他多摄像头收集的图像不同,ETHZ收集的图像来自移动摄像头。
  • 特点: 视角变化小,但光照、尺度变化和遮挡较大。

QMUL iLIDS

  • 描述: 基于iLIDS MCTS,数据集在机场繁忙时段由多摄像头CCTV系统收集。
  • 特点: 几乎每个身份都有来自两个非重叠摄像头的四张图像,场景中存在严重遮挡和姿态变化。

GRID

  • 描述: 由8个不重叠的摄像头在繁忙的地下车站收集。
  • 特点: 每个身份有两张来自不同视角的图像,画廊集的图像比探测集多,图像质量较差。

CAVIAR4ReID

  • 描述: 从多目标跟踪数据集CAVIAR中提取,收集于购物中心的两个监控摄像头。
  • 特点: 72个身份中,50个有两摄像头视角的图像,其余22个只有一个摄像头视角。

3DPeS

  • 描述: 由8个非重叠的户外摄像头收集。
  • 特点: 提供原始视频,但研究人员通常使用选定的快照测试人员重新识别算法。

PRID2011

  • 描述: 有385个轨迹来自摄像头A,749个轨迹来自摄像头B。
  • 特点: 只有200人在两个摄像头中都出现,单次拍摄版本包含随机选择的快照。

V47

  • 描述: 使用两个室内摄像头收集,视野重叠。
  • 特点: 每个身份以两种不同方向(进出)和多个不同视角捕捉。

WARD

  • 描述: 由三个非重叠摄像头收集。
  • 特点: 每个身份在每个摄像头中有多个图像,图像似乎是标记的轨迹,但作者未保证。

SAIVT-Softbio

  • 描述: 由八个现有的监控摄像头收集。
  • 特点: 由于是无控制的收集,大多数身份只通过部分摄像头。

CUHK01

  • 描述: 包含每个身份从每个摄像头获取的两张图像。
  • 特点: 有一对不重叠的摄像头,图像质量相对较好。

CUHK02

  • 描述: CUHK01的扩展数据集。
  • 特点: 除了CUHK01中的摄像头对,还有四个额外的摄像头对设置。

CUHK03

  • 描述: 第一个足够大的深度学习人员重新识别数据集。
  • 特点: 提供由可变形部件模型(DPM)检测和手动标记的边界框。

RAiD

  • 描述: 作为相对较新的发布数据集,RAiD保证每个身份在所有四个非重叠摄像头中都有图像。
  • 特点: 由于两个摄像头是室内的,另外两个是室外的,光照变化非常大。

iLIDS-VID

  • 描述: 基于假设,真实的重新识别系统应为每个身份提供轨迹。
  • 特点: 从iLIDS MCTS数据集中提取600个轨迹,用于300个身份,由于iLIDS MCTS数据集的限制,iLIDS-VID有极重的遮挡。

MPR Drone

  • 描述: 不是传统的跨摄像头网络的人员重新识别数据集,而是由飞行无人机在室内外环境中收集。
  • 特点: 由于只有一个摄像头,作者在原始论文中提出了三种不同类型的评估实验。

HDA Person Dataset

  • 描述: 旨在尽可能接近真实的重新识别系统。
  • 特点: 在30分钟内,85人被密集标记在13个摄像头上。

Shinpuhkan Dataset

  • 描述: 最初创建用于测试多摄像头跟踪方法。
  • 特点: 每个身份在每个摄像头中有多个跟踪片段,总共每个身份有86个注释跟踪片段。

CASIA Gait Database B

  • 描述: 最初用于测试步态识别算法,2015年Liu等人重新使用此数据集测试基于步态的人员重新识别算法。
  • 特点: 由11个重叠摄像头在不同视角角度收集,每个身份还改变服装和携带条件。

Market1501

  • 描述: 包含大量身份,每个身份有来自六个不重叠摄像头的几张图像。
  • 特点: 还包括2793个由DPM产生的假警报作为干扰项,以模拟真实场景。

PKU-Reid

  • 描述: 与其他现代重新识别数据集相比相对较小。
  • 特点: 该数据集的关键特征是它从两个不重叠的摄像头中捕捉到所有八个方向的人员外观。

PRW

  • 描述: 由六个摄像头收集,每个摄像头捕捉多个图像。
  • 特点: 图像质量变化,包括全帧可用性。

Large scale person search

  • 描述: 大规模人员搜索数据集。
  • 特点: 包括11934个身份,图像来自多个摄像头,全帧可用。

MARS

  • 描述: 包含1261个身份,由六个摄像头收集。
  • 特点: 提供由DPM+GMMCP检测的边界框,支持多镜头和跟踪序列。

DukeMTMC-reID

  • 描述: 包含1812个身份,由八个摄像头收集。
  • 特点: 提供手工标记的图像,支持多镜头。

DukeMTMC4ReID

  • 描述: 包含1852个身份,由八个摄像头收集。
  • 特点: 使用Doppia方法标记,支持多镜头。

Airport

  • 描述: 包含9651个身份,由六个摄像头收集。
  • 特点: 使用ACF方法标记,支持多镜头。

MSMT17

  • 描述: 包含4101个身份,由15个摄像头收集。
  • 特点: 使用Faster RCNN方法标记,支持多镜头。

RPIfield

  • 描述: 包含112个身份,由12个摄像头收集。
  • 特点: 使用ACF方法标记,支持多镜头和跟踪序列。
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集包含了多个子数据集,每个子数据集的构建方式各异,但总体上都是通过在多个相机中捕捉行人的图像来构建的。例如,VIPeR数据集包含两个相机,每个相机捕捉一个人的图像;ETH1,2,3数据集则是通过一个移动的相机收集图像;GRID数据集是由八个不相交的相机在一个繁忙的地下站收集的。这些数据集通常提供视图角度、图像质量、相机数量等信息,以供研究人员测试和改进行人重识别算法。
使用方法
使用这些数据集时,研究人员需要遵循每个数据集的具体使用协议和许可。一般而言,研究人员会下载数据集,然后根据数据集提供的标注和图像信息,进行行人重识别算法的训练和测试。部分数据集还提供了评估工具,以便研究人员可以方便地测试和比较不同算法的性能。
背景与挑战
背景概述
在计算机视觉领域中,行人重识别(Person Re-identification,简称ReID)吸引了研究者们的广泛关注。VIPeR、ETH1,2,3、QMUL iLIDS等数据集的创建,标志着该领域研究的一个重要里程碑。这些数据集主要在2007年至2014年间发布,由多个研究团队或机构共同构建,旨在解决不同场景下行人重识别的核心研究问题,如视角变化、光照变化、遮挡等。它们为相关领域的研究提供了宝贵的数据资源,并极大地推动了行人重识别技术的发展。
当前挑战
这些数据集在构建过程中遇到的挑战主要包括:1) 数据集的多样性和复杂性,如ETH1,2,3数据集收集了移动相机拍摄的视频,其视角变化小,但光照和尺度变化大;2) 数据标注的准确性,如在QMUL iLIDS和SAIVT-Softbio数据集中,标注的轨迹和边界框需要精确以供算法训练和评估;3) 数据集的规模和覆盖范围,如Market1501数据集包含了大规模的身份证和图像,对算法的泛化能力提出了更高的要求。这些挑战推动了数据集的持续更新和优化,以适应不断发展的行人重识别算法需求。
常用场景
经典使用场景
VIPeR数据集因其视角变化大、图像数量少而具有挑战性,常被用于评估行人重识别算法在视角不变性方面的性能。ETH1,2,3数据集则因其场景光照变化大、尺度变化和遮挡问题而被用于测试算法的鲁棒性。QMUL iLIDS、GRID、CAVIAR4ReID等数据集提供了不同场景下的多摄像机图像,用于评估算法在多摄像机网络中的表现。这些数据集在学术研究中被广泛用作基准,以验证和比较不同行人重识别算法的有效性。
解决学术问题
这些数据集解决了行人重识别领域中的多个关键问题,包括视角变化、光照变化、遮挡和尺度变化等对识别性能的影响。通过这些数据集,研究人员能够开发出更鲁棒的算法,提高在不同环境和条件下行人识别的准确性,对于提升公共安全、视频监控等领域的技术水平具有重要意义。
实际应用
在实际应用中,这些行人重识别数据集被用于开发智能视频监控系统,可以帮助识别和追踪公共场所中的特定个体,对于公共安全、事件监控和商场管理等场景有直接的应用价值。此外,这些技术也被用于增强个人设备的隐私保护,如手机和计算机的解锁机制。
数据集最近研究
最新研究方向
在近期关于人物重识别的研究中,学者们不断探索着更为高效的特征提取与匹配算法。VIPeR、ETH1,2,3等数据集因其视角变化、光照差异等挑战而被广泛研究,以提升算法的鲁棒性。CUHK03数据集的引入,为深度学习方法提供了充足的训练样本,推动了基于深度学习的人物重识别技术的发展。同时,对于多摄像头跟踪和跨视角识别的研究,如iLIDS-VID和HDA Person Dataset等数据集的应用,进一步推动了人物重识别技术在现实世界中的应用。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务