VIPeR, ETH1,2,3, QMUL iLIDS, GRID, CAVIAR4ReID, 3DPeS, PRID2011, V47, WARD, SAIVT-Softbio, CUHK01, CUHK02, CUHK03, RAiD

github2020-05-17 更新2024-05-31 收录

下载链接：

https://github.com/zhengkang86/awesome-reid-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个收集公共可用的人物再识别数据集的仓库，包含多个数据集的详细信息，如发布时间、身份数量、摄像头数量、图像数量等。

This repository aggregates publicly available datasets for person re-identification, encompassing detailed information on multiple datasets such as release dates, the number of identities, the number of cameras, and the number of images.

创建时间：

2019-07-05

原始信息汇总

数据集概述

数据集列表

数据集	发布时间	身份数量	摄像头数量	图像数量	标签方法	裁剪尺寸	多镜头	跟踪序列	全帧可用性
VIPeR	2007	632	2	1264	手工	128X48
ETH1,2,3	2007	85, 35, 28	1	8580	手工	变化	✔	✔	✔
QMUL iLIDS	2009	119	2	476	手工	变化	✔
GRID	2009	1025	8	1275	手工	变化
CAVIAR4ReID	2011	72	2	1220	手工	变化	✔
3DPeS	2011	192	8	1011	手工	变化	✔		✔*
PRID2011	2011	934	2	24541	手工	128X64	✔	✔	✔*
V47	2011	47	2	752	手工	变化	✔		✔
WARD	2012	70	3	4786	手工	128X48	✔	✔
SAIVT-Softbio	2012	152	8	64472	手工	变化	✔	✔	✔
CUHK01	2012	971	2	3884	手工	160X60	✔
CUHK02	2013	1816	10(5 pairs)	7264	手工	160X60	✔
CUHK03	2014	1467	10(5 pairs)	13164	手工/DPM	变化	✔
RAiD	2014	43	4	6920	手工	128X64	✔
iLIDS-VID	2014	300	2	42495	手工	变化	✔	✔
MPR Drone	2014	84	1		金字塔特征(ACF)	变化	✔		✔
HDA Person Dataset	2014	53	13	2976	手工/金字塔特征(ACF)	变化	✔	✔	✔
Shinpuhkan Dataset	2014	24	16		手工	128X48	✔	✔
CASIA Gait Database B	2015(*see below)	124	11		背景减除	变化	✔	✔	✔
Market1501	2015	1501	6	32217	手工/DPM	128X64	✔
PKU-Reid	2016	114	2	1824	手工	128X64
PRW	2016	932	6	34304	手工	变化	✔		✔
Large scale person search	2016	11934s	-	34574	手工	变化			✔
MARS	2016	1261	6	1191003	DPM+GMMCP	256X128	✔	✔
DukeMTMC-reID	2017	1812	8	36441	手工	变化	✔		✔
DukeMTMC4ReID	2017	1852	8	46261	Doppia	变化	✔		✔
Airport	2017	9651	6	39902	ACF	128X64	✔
MSMT17	2018	4101	15	126441	Faster RCNN	变化	✔
RPIfield	2018	112	12	601,581	ACF	变化	✔	✔

数据集详细信息

VIPeR

描述: 包含两个摄像头，每个摄像头捕捉一个人的图像，提供视角角度。
特点: 尽管经过多次测试，仍是最具挑战性的数据集之一。

ETH1,2,3

描述: 与其他多摄像头收集的图像不同，ETHZ收集的图像来自移动摄像头。
特点: 视角变化小，但光照、尺度变化和遮挡较大。

QMUL iLIDS

描述: 基于iLIDS MCTS，数据集在机场繁忙时段由多摄像头CCTV系统收集。
特点: 几乎每个身份都有来自两个非重叠摄像头的四张图像，场景中存在严重遮挡和姿态变化。

GRID

描述: 由8个不重叠的摄像头在繁忙的地下车站收集。
特点: 每个身份有两张来自不同视角的图像，画廊集的图像比探测集多，图像质量较差。

CAVIAR4ReID

描述: 从多目标跟踪数据集CAVIAR中提取，收集于购物中心的两个监控摄像头。
特点: 72个身份中，50个有两摄像头视角的图像，其余22个只有一个摄像头视角。

3DPeS

描述: 由8个非重叠的户外摄像头收集。
特点: 提供原始视频，但研究人员通常使用选定的快照测试人员重新识别算法。

PRID2011

描述: 有385个轨迹来自摄像头A，749个轨迹来自摄像头B。
特点: 只有200人在两个摄像头中都出现，单次拍摄版本包含随机选择的快照。

V47

描述: 使用两个室内摄像头收集，视野重叠。
特点: 每个身份以两种不同方向（进出）和多个不同视角捕捉。

WARD

描述: 由三个非重叠摄像头收集。
特点: 每个身份在每个摄像头中有多个图像，图像似乎是标记的轨迹，但作者未保证。

SAIVT-Softbio

描述: 由八个现有的监控摄像头收集。
特点: 由于是无控制的收集，大多数身份只通过部分摄像头。

CUHK01

描述: 包含每个身份从每个摄像头获取的两张图像。
特点: 有一对不重叠的摄像头，图像质量相对较好。

CUHK02

描述: CUHK01的扩展数据集。
特点: 除了CUHK01中的摄像头对，还有四个额外的摄像头对设置。

CUHK03

描述: 第一个足够大的深度学习人员重新识别数据集。
特点: 提供由可变形部件模型（DPM）检测和手动标记的边界框。

RAiD

描述: 作为相对较新的发布数据集，RAiD保证每个身份在所有四个非重叠摄像头中都有图像。
特点: 由于两个摄像头是室内的，另外两个是室外的，光照变化非常大。

iLIDS-VID

描述: 基于假设，真实的重新识别系统应为每个身份提供轨迹。
特点: 从iLIDS MCTS数据集中提取600个轨迹，用于300个身份，由于iLIDS MCTS数据集的限制，iLIDS-VID有极重的遮挡。

MPR Drone

描述: 不是传统的跨摄像头网络的人员重新识别数据集，而是由飞行无人机在室内外环境中收集。
特点: 由于只有一个摄像头，作者在原始论文中提出了三种不同类型的评估实验。

HDA Person Dataset

描述: 旨在尽可能接近真实的重新识别系统。
特点: 在30分钟内，85人被密集标记在13个摄像头上。

Shinpuhkan Dataset

描述: 最初创建用于测试多摄像头跟踪方法。
特点: 每个身份在每个摄像头中有多个跟踪片段，总共每个身份有86个注释跟踪片段。

CASIA Gait Database B

描述: 最初用于测试步态识别算法，2015年Liu等人重新使用此数据集测试基于步态的人员重新识别算法。
特点: 由11个重叠摄像头在不同视角角度收集，每个身份还改变服装和携带条件。

Market1501

描述: 包含大量身份，每个身份有来自六个不重叠摄像头的几张图像。
特点: 还包括2793个由DPM产生的假警报作为干扰项，以模拟真实场景。

PKU-Reid

描述: 与其他现代重新识别数据集相比相对较小。
特点: 该数据集的关键特征是它从两个不重叠的摄像头中捕捉到所有八个方向的人员外观。

PRW

描述: 由六个摄像头收集，每个摄像头捕捉多个图像。
特点: 图像质量变化，包括全帧可用性。

Large scale person search

描述: 大规模人员搜索数据集。
特点: 包括11934个身份，图像来自多个摄像头，全帧可用。

MARS

描述: 包含1261个身份，由六个摄像头收集。
特点: 提供由DPM+GMMCP检测的边界框，支持多镜头和跟踪序列。

DukeMTMC-reID

描述: 包含1812个身份，由八个摄像头收集。
特点: 提供手工标记的图像，支持多镜头。

DukeMTMC4ReID

描述: 包含1852个身份，由八个摄像头收集。
特点: 使用Doppia方法标记，支持多镜头。

Airport

描述: 包含9651个身份，由六个摄像头收集。
特点: 使用ACF方法标记，支持多镜头。

MSMT17

描述: 包含4101个身份，由15个摄像头收集。
特点: 使用Faster RCNN方法标记，支持多镜头。

RPIfield

描述: 包含112个身份，由12个摄像头收集。
特点: 使用ACF方法标记，支持多镜头和跟踪序列。

搜集汇总

数据集介绍

构建方式

该数据集包含了多个子数据集，每个子数据集的构建方式各异，但总体上都是通过在多个相机中捕捉行人的图像来构建的。例如，VIPeR数据集包含两个相机，每个相机捕捉一个人的图像；ETH1,2,3数据集则是通过一个移动的相机收集图像；GRID数据集是由八个不相交的相机在一个繁忙的地下站收集的。这些数据集通常提供视图角度、图像质量、相机数量等信息，以供研究人员测试和改进行人重识别算法。

使用方法

使用这些数据集时，研究人员需要遵循每个数据集的具体使用协议和许可。一般而言，研究人员会下载数据集，然后根据数据集提供的标注和图像信息，进行行人重识别算法的训练和测试。部分数据集还提供了评估工具，以便研究人员可以方便地测试和比较不同算法的性能。

背景与挑战

背景概述

在计算机视觉领域中，行人重识别（Person Re-identification，简称ReID）吸引了研究者们的广泛关注。VIPeR、ETH1,2,3、QMUL iLIDS等数据集的创建，标志着该领域研究的一个重要里程碑。这些数据集主要在2007年至2014年间发布，由多个研究团队或机构共同构建，旨在解决不同场景下行人重识别的核心研究问题，如视角变化、光照变化、遮挡等。它们为相关领域的研究提供了宝贵的数据资源，并极大地推动了行人重识别技术的发展。

当前挑战

这些数据集在构建过程中遇到的挑战主要包括：1) 数据集的多样性和复杂性，如ETH1,2,3数据集收集了移动相机拍摄的视频，其视角变化小，但光照和尺度变化大；2) 数据标注的准确性，如在QMUL iLIDS和SAIVT-Softbio数据集中，标注的轨迹和边界框需要精确以供算法训练和评估；3) 数据集的规模和覆盖范围，如Market1501数据集包含了大规模的身份证和图像，对算法的泛化能力提出了更高的要求。这些挑战推动了数据集的持续更新和优化，以适应不断发展的行人重识别算法需求。

常用场景

经典使用场景

VIPeR数据集因其视角变化大、图像数量少而具有挑战性，常被用于评估行人重识别算法在视角不变性方面的性能。ETH1,2,3数据集则因其场景光照变化大、尺度变化和遮挡问题而被用于测试算法的鲁棒性。QMUL iLIDS、GRID、CAVIAR4ReID等数据集提供了不同场景下的多摄像机图像，用于评估算法在多摄像机网络中的表现。这些数据集在学术研究中被广泛用作基准，以验证和比较不同行人重识别算法的有效性。

解决学术问题

这些数据集解决了行人重识别领域中的多个关键问题，包括视角变化、光照变化、遮挡和尺度变化等对识别性能的影响。通过这些数据集，研究人员能够开发出更鲁棒的算法，提高在不同环境和条件下行人识别的准确性，对于提升公共安全、视频监控等领域的技术水平具有重要意义。

实际应用

在实际应用中，这些行人重识别数据集被用于开发智能视频监控系统，可以帮助识别和追踪公共场所中的特定个体，对于公共安全、事件监控和商场管理等场景有直接的应用价值。此外，这些技术也被用于增强个人设备的隐私保护，如手机和计算机的解锁机制。

数据集最近研究