VIPeR, ETH1,2,3, QMUL iLIDS, GRID, CAVIAR4ReID, 3DPeS, PRID2011, V47, WARD, SAIVT-Softbio, CUHK01, CUHK02, CUHK03
收藏github2020-06-12 更新2024-05-31 收录
下载链接:
https://github.com/tomFoxxxx/awesome-reid-dataset
下载链接
链接失效反馈官方服务:
资源简介:
这是一个收集公开可用的人员重新识别数据集的仓库,包括VIPeR、ETH1,2,3等多个数据集,每个数据集都有详细的发布时间、身份数量、摄像机数量、图像数量等信息。
This repository aggregates publicly available datasets for person re-identification, encompassing multiple datasets such as VIPeR, ETH1, ETH2, and ETH3. Each dataset is accompanied by comprehensive details including release dates, the number of identities, the number of cameras, and the quantity of images.
创建时间:
2020-06-12
原始信息汇总
数据集概述
数据集列表
| 数据集 | 发布时间 | 身份数 | 摄像头数 | 图像数 | 标签方法 | 裁剪尺寸 | 多镜头 | 跟踪序列 | 全帧可用性 |
|---|---|---|---|---|---|---|---|---|---|
| VIPeR | 2007 | 632 | 2 | 1264 | 手工 | 128X48 | |||
| ETH1,2,3 | 2007 | 85, 35, 28 | 1 | 8580 | 手工 | 变化 | ✔ | ✔ | ✔ |
| QMUL iLIDS | 2009 | 119 | 2 | 476 | 手工 | 变化 | ✔ | ||
| GRID | 2009 | 1025 | 8 | 1275 | 手工 | 变化 | |||
| CAVIAR4ReID | 2011 | 72 | 2 | 1220 | 手工 | 变化 | ✔ | ||
| 3DPeS | 2011 | 192 | 8 | 1011 | 手工 | 变化 | ✔ | ✔* | |
| PRID2011 | 2011 | 934 | 2 | 24541 | 手工 | 128X64 | ✔ | ✔ | ✔* |
| V47 | 2011 | 47 | 2 | 752 | 手工 | 变化 | ✔ | ✔ | |
| WARD | 2012 | 70 | 3 | 4786 | 手工 | 128X48 | ✔ | ✔ | |
| SAIVT-Softbio | 2012 | 152 | 8 | 64472 | 手工 | 变化 | ✔ | ✔ | ✔ |
| CUHK01 | 2012 | 971 | 2 | 3884 | 手工 | 160X60 | ✔ | ||
| CUHK02 | 2013 | 1816 | 10(5 pairs) | 7264 | 手工 | 160X60 | ✔ | ||
| CUHK03 | 2014 | 1467 | 10(5 pairs) | 13164 | 手工/DPM | 变化 | ✔ | ||
| RAiD | 2014 | 43 | 4 | 6920 | 手工 | 128X64 | ✔ | ||
| iLIDS-VID | 2014 | 300 | 2 | 42495 | 手工 | 变化 | ✔ | ✔ | |
| MPR Drone | 2014 | 84 | 1 | 金字塔特征(ACF) | 变化 | ✔ | ✔ | ||
| HDA Person Dataset | 2014 | 53 | 13 | 2976 | 手工/金字塔特征(ACF) | 变化 | ✔ | ✔ | ✔ |
| Shinpuhkan Dataset | 2014 | 24 | 16 | 手工 | 128X48 | ✔ | ✔ | ||
| CASIA Gait Database B | 2015 | 124 | 11 | 背景减除 | 变化 | ✔ | ✔ | ✔ | |
| Market1501 | 2015 | 1501 | 6 | 32217 | 手工/DPM | 128X64 | ✔ | ||
| PKU-Reid | 2016 | 114 | 2 | 1824 | 手工 | 128X64 | |||
| PRW | 2016 | 932 | 6 | 34304 | 手工 | 变化 | ✔ | ✔ | |
| Large scale person search | 2016 | 11934s | - | 34574 | 手工 | 变化 | ✔ | ||
| MARS | 2016 | 1261 | 6 | 1191003 | DPM+GMMCP | 256X128 | ✔ | ✔ | |
| DukeMTMC-reID/DukeMTMC4ReID | 2017 | 1812/1852 | 8 | 36441/46261 | 手工/Doppia | 变化 | ✔ | ✔ | |
| Airport | 2017 | 9651 | 6 | 39902 | ACF | 128X64 | ✔ | ||
| MSMT17 | 2018 | 4101 | 15 | 126441 | Faster RCNN | 变化 | ✔ | ||
| RPIfield | 2018 | 112 | 12 | 601,581 | ACF | 变化 | ✔ | ✔ | |
| LPW | 2018 | 2,731 | 3,4,4 | 592,438 | Detector+NN+Hand | - | ✔ | ✔ | |
| PKU SketchRe-ID | 2018 | 200 | 2 | 400 | 手工 | - | |||
| ThermalWorld | 2018 | 516 | 20 | 15,118 | 手工 | - |
新增数据集
- LPW, PKU Sketch-ReID 和 ThermalWorld 已添加。
- RPIfield 已添加。
- MSMT17 数据已添加。
- 机场数据集已添加。
搜集汇总
数据集介绍

构建方式
该数据集集合了多个公开的行人重识别数据集,涵盖了从2007年至2018年间发布的多个经典数据集。每个数据集均通过不同的摄像头设置采集,涵盖了多种场景下的行人图像。数据集的构建主要依赖于手动标注和自动检测技术,部分数据集还提供了视频序列和3D环境模型,以增强数据的多样性和复杂性。
特点
这些数据集的特点在于其多样性和挑战性。每个数据集均包含不同数量的行人身份、摄像头数量和图像数量,涵盖了从单一摄像头到多摄像头的复杂场景。数据集中的图像质量、视角变化、光照条件和遮挡情况各不相同,为行人重识别算法的研究提供了丰富的实验环境。部分数据集还提供了多帧序列和轨迹信息,进一步增加了数据的复杂性。
使用方法
使用这些数据集时,研究人员可以根据具体需求选择适合的数据集进行实验。每个数据集通常提供了详细的标注信息,包括行人身份、摄像头编号和图像裁剪尺寸等。研究人员可以通过加载数据集中的图像和标注信息,进行行人重识别算法的训练和测试。部分数据集还提供了评估工具和基准代码,便于研究人员进行算法性能的对比和分析。
背景与挑战
背景概述
VIPeR、ETH1,2,3、QMUL iLIDS等数据集是计算机视觉领域中行人重识别(Person Re-Identification, ReID)研究的重要基石。这些数据集自2007年起陆续发布,涵盖了从静态图像到视频序列的多种数据形式,旨在解决跨摄像头行人匹配的核心问题。VIPeR作为早期代表性数据集,由UCSC的研究团队于2007年发布,首次引入了视角变化的挑战。ETH1,2,3数据集则通过移动摄像头捕捉行人图像,强调了光照和尺度变化的影响。这些数据集的构建为行人重识别算法的评估提供了标准化平台,推动了深度学习在该领域的应用。CUHK03等大规模数据集的发布进一步促进了基于深度学习的行人重识别研究,成为该领域的重要里程碑。
当前挑战
行人重识别数据集在构建和应用中面临多重挑战。首先,跨摄像头视角变化、光照差异、遮挡以及行人姿态多样性是算法性能提升的主要障碍。例如,VIPeR数据集虽然规模较小,但其视角变化和复杂的背景环境使其成为极具挑战性的基准。其次,数据集的构建过程也面临诸多困难,如手动标注的高成本、摄像头视角的非重叠性以及数据采集环境的复杂性。以CUHK03为例,其通过DPM检测和人工标注相结合的方式获取行人边界框,但检测质量的不一致性仍对算法评估造成影响。此外,数据集的规模扩展与真实场景的模拟也是重要挑战,Market1501等大规模数据集的发布虽缓解了这一问题,但仍需进一步优化以更好地反映实际应用场景。
常用场景
经典使用场景
在计算机视觉领域,VIPeR、ETH1,2,3、QMUL iLIDS等数据集被广泛用于行人重识别算法的评估与优化。这些数据集通过多摄像头捕捉不同视角下的行人图像,模拟真实场景中的复杂环境,如光照变化、遮挡和姿态多样性。研究人员利用这些数据集训练和测试模型,以提升行人重识别的准确性和鲁棒性。
解决学术问题
这些数据集解决了行人重识别领域中的多个关键问题,包括跨摄像头视角变化、光照不一致、遮挡和姿态多样性等挑战。通过提供丰富的标注数据和多样化的场景,研究人员能够开发出更具泛化能力的算法,推动行人重识别技术的进步。这些数据集还为深度学习模型的训练提供了大规模、高质量的数据支持,显著提升了模型的性能。
衍生相关工作
基于这些数据集,许多经典的行人重识别算法得以诞生。例如,CUHK03数据集推动了深度学习在行人重识别中的应用,催生了DeepReID等先进模型。Market1501数据集则引入了大规模评估标准,促进了mAP等评价指标的普及。此外,这些数据集还激发了跨模态行人重识别、无监督学习和域适应等新兴研究方向。
以上内容由遇见数据集搜集并总结生成



