five

VIPeR, ETH1,2,3, QMUL iLIDS, GRID, CAVIAR4ReID, 3DPeS, PRID2011, V47, WARD, SAIVT-Softbio, CUHK01, CUHK02, CUHK03|人重新识别数据集|计算机视觉数据集

收藏
github2024-04-28 更新2024-05-31 收录
人重新识别
计算机视觉
下载链接:
https://github.com/NEU-Gou/awesome-reid-dataset
下载链接
链接失效反馈
资源简介:
这是一个收集公共可用的人重新识别数据集的仓库,包含多个数据集,每个数据集都有详细的描述,如发布时间、身份数量、摄像机数量、图像数量等。

This repository aggregates publicly available datasets for person re-identification, encompassing multiple datasets. Each dataset is accompanied by detailed descriptions, including release dates, the number of identities, the number of cameras, and the quantity of images, among other specifics.
创建时间:
2018-10-06
原始信息汇总

数据集概述

本数据集页面收集了所有公开的用于人员再识别(Person Re-Identification)算法测试的数据集。以下是各数据集的关键信息概览:

数据集列表

数据集 发布时间 身份数量 摄像头数量 图像数量 标签方法 裁剪尺寸 多镜头 跟踪序列 全帧可用性
VIPeR 2007 632 2 1264 手工 128X48
ETH1,2,3 2007 85, 35, 28 1 8580 手工 变化
QMUL iLIDS 2009 119 2 476 手工 变化
GRID 2009 1025 8 1275 手工 变化
CAVIAR4ReID 2011 72 2 1220 手工 变化
3DPeS 2011 192 8 1011 手工 变化 ✔*
PRID2011 2011 934 2 24541 手工 128X64 ✔*
V47 2011 47 2 752 手工 变化
WARD 2012 70 3 4786 手工 128X48
SAIVT-Softbio 2012 152 8 64472 手工 变化
CUHK01 2012 971 2 3884 手工 160X60
CUHK02 2013 1816 10(5 pairs) 7264 手工 160X60
CUHK03 2014 1467 10(5 pairs) 13164 手工/DPM 变化
RAiD 2014 43 4 6920 手工 128X64
iLIDS-VID 2014 300 2 42495 手工 变化
MPR Drone 2014 84 1 金字塔特征(ACF) 变化
HDA Person Dataset 2014 53 13 2976 手工/金字塔特征(ACF) 变化
Shinpuhkan Dataset 2014 24 16 手工 128X48
CASIA Gait Database B 2015 124 11 背景减法 变化
Market1501 2015 1501 6 32217 手工/DPM 128X64
PKU-Reid 2016 114 2 1824 手工 128X64
PRW 2016 932 6 34304 手工 变化
Large scale person search 2016 11934s - 34574 手工 变化
MARS 2016 1261 6 1191003 DPM+GMMCP 256X128
DukeMTMC-reID 2017 1812 8 36441 手工 变化
DukeMTMC4ReID 2017 1852 8 46261 Doppia 变化
Airport 2017 9651 6 39902 ACF 128X64
MSMT17 2018 4101 15 126441 Faster RCNN 变化
RPIfield 2018 112 12 601,581 ACF 变化
LPW 2018 2,731 3,4,4 592,438 Detector+NN+Hand -
PKU SketchRe-ID 2018 200 2 400 手工 -
ThermalWorld 2018 516 20 15,118 手工 -
SoccerNet-ReID 2022 243,432 - 340,993 手工 变化
DeepSportradar-ReID 2022 486 - 9529 手工 变化
LaST 2022 10862 - 228k Detector+Hand 变化
MALS 2023 1,510,330 合成 1,510,330 BLIP 变化

数据集详情

  • VIPeR: 包含两个摄像头,每个摄像头捕捉一个人的图像,提供视角角度。
  • ETH1,2,3: 收集自移动摄像头,具有较大的光照和尺度变化。
  • QMUL iLIDS: 基于机场繁忙时间的CCTV系统数据,具有重遮挡和姿态变化。
  • GRID: 由8个非重叠摄像头在繁忙的地下车站收集。
  • CAVIAR4ReID: 从购物中心的两个监控摄像头提取,具有视场重叠。
  • 3DPeS: 由8个非重叠户外摄像头收集,提供3D环境和摄像头校准数据。
  • PRID2011: 包含385个摄像头A的轨迹和749个摄像头B的轨迹,仅有200人在两个摄像头中都出现。
  • V47: 使用两个室内摄像头收集,每个身份在不同方向上被捕捉。
  • WARD: 由三个非重叠摄像头收集,每个身份在每个摄像头中有多张图像。
  • SAIVT-Softbio: 由八个现有监控摄像头收集,提供全视频帧和标记的边界框。
  • CUHK01: 包含每个身份在每个摄像头中的两张图像,图像质量相对较好。
  • CUHK02: 是CUHK01的扩展,增加了四个额外的摄像头对设置。
  • CUHK03: 第一个足够大的深度学习人员再识别数据集,提供DPM检测和手工标记的边界框。
  • RAiD: 每个身份在所有四个非重叠摄像头中都有图像,光照变化大。
  • iLIDS-VID: 从iLIDS MCTS数据集中提取600个轨迹,具有极重的遮挡。
  • MPR Drone: 由飞行无人机在室内外环境中收集,使用金字塔特征检测。
  • HDA Person Dataset: 旨在尽可能接近真实的人员再识别系统,提供紧密的边界框和遮挡标志。
  • Shinpuhkan Dataset: 最初用于测试多摄像头跟踪方法,每个身份有多个跟踪片段。
  • CASIA Gait Database B: 最初用于测试步态识别算法,由11个重叠摄像头收集,提供原始视频帧和轮廓。
  • Market1501: 提供DPM检测和手工标记的边界框,用于深度学习。
  • PKU-Reid: 由两个摄像头收集,每个身份有两张图像。
  • PRW: 由六个摄像头收集,每个身份有多张图像,图像质量变化。
  • Large scale person search: 用于大规模人员搜索,全帧可用。
  • MARS: 提供DPM+GMMCP标记,用于深度学习。
  • DukeMTMC-reID: 由八个摄像头收集,每个身份有多张图像。
  • DukeMTMC4ReID: 使用Doppia标记,每个身份有多张图像。
  • Airport: 使用ACF标记,每个身份有多张图像。
  • MSMT17: 使用Faster RCNN标记,用于深度学习。
  • RPIfield: 由12个摄像头收集,每个身份有多张图像。
  • LPW: 使用Detector+NN+Hand标记,每个身份有多张图像。
  • PKU SketchRe-ID: 由两个摄像头收集,每个身份有两张图像。
  • ThermalWorld: 由20个摄像头收集,每个身份有多张图像。
  • SoccerNet-ReID: 用于足球场景中的人员再识别,全帧可用。
  • DeepSportradar-ReID: 用于体育场景中的人员再识别,每个身份有多张图像。
  • LaST: 使用Detector+Hand标记,用于深度学习。
  • MALS: 使用BLIP标记,每个身份有多张图像。

以上数据集为人员再识别领域的研究提供了丰富的资源和多样化的场景,有助于推动该领域的技术发展。

AI搜集汇总
数据集介绍
main_image_url
构建方式
这些数据集的构建方式主要通过在不同场景和条件下,使用多个摄像头捕捉行人图像。每个数据集都详细记录了摄像头的数量、图像的分辨率、以及是否有多视角或多时间点的图像。例如,VIPeR数据集通过两个摄像头捕捉每个行人的图像,而ETH1,2,3数据集则通过移动摄像头捕捉图像,以模拟实际监控环境中的视角和光照变化。这些数据集的标签主要由人工标注完成,确保了数据的准确性和一致性。
特点
这些数据集的主要特点在于其多样性和复杂性。它们涵盖了从室内到室外、从单摄像头到多摄像头的多种场景,且每个数据集都有其独特的挑战,如光照变化、视角差异、遮挡和姿态变化等。例如,QMUL iLIDS数据集在机场繁忙时段收集,具有较高的遮挡和姿态变化,而PRID2011数据集则包含了不同摄像头之间的行人轨迹,增加了时间同步的挑战。这些特点使得这些数据集成为评估和提升行人再识别算法性能的理想选择。
使用方法
这些数据集主要用于评估和训练行人再识别算法。研究者可以根据数据集的特性选择合适的子集进行实验,如选择具有特定光照或视角变化的图像进行训练。使用这些数据集时,通常需要遵循数据集提供的标签和使用协议,确保实验的公平性和可重复性。此外,数据集的多样性也允许研究者进行跨数据集的泛化能力测试,以评估算法的鲁棒性和适应性。
背景与挑战
背景概述
在计算机视觉领域,行人重识别(Person Re-Identification, ReID)技术近年来受到了广泛关注。该技术旨在跨不同摄像头识别同一行人,广泛应用于安防监控、智能交通等领域。上述数据集,如VIPeR、ETH1,2,3、QMUL iLIDS等,均是行人重识别研究中的经典数据集。这些数据集由不同研究机构在不同时间和场景下创建,涵盖了从2007年到2024年的多个版本,主要研究人员包括David Gray、H. Tao、W. Li等。这些数据集的核心研究问题是如何在多摄像头环境下准确识别和匹配同一行人,对提升行人重识别算法的鲁棒性和准确性具有重要影响。
当前挑战
行人重识别数据集在构建和应用过程中面临多重挑战。首先,数据集的多样性和复杂性要求算法能够处理不同光照、视角和遮挡条件下的行人图像。其次,数据集的标注和采集过程复杂,需要大量人工和时间成本,且标注质量直接影响算法性能。此外,数据集的规模和覆盖场景有限,难以完全模拟真实世界的复杂情况。最后,随着深度学习技术的发展,如何有效利用大规模数据集进行模型训练和验证,同时避免过拟合,也是当前研究的重要挑战。
常用场景
经典使用场景
在计算机视觉领域,行人重识别(Person Re-Identification, ReID)数据集如VIPeR、ETH1,2,3、QMUL iLIDS等,常用于评估和提升算法在不同摄像头视角下识别同一行人的能力。这些数据集通过模拟真实世界中的多摄像头监控环境,提供了丰富的视角、光照和姿态变化,使得研究人员能够开发和测试具有鲁棒性的行人重识别算法。
实际应用
在实际应用中,行人重识别数据集如GRID、PRID2011和CUHK03等,被广泛应用于智能监控系统、公共安全、交通管理和犯罪侦查等领域。通过这些数据集训练的算法,能够有效地在多摄像头网络中识别和追踪目标行人,提高了监控系统的效率和准确性。此外,这些数据集也为跨摄像头追踪和身份验证等实际应用提供了技术支持。
衍生相关工作
基于这些行人重识别数据集,研究人员开发了多种经典算法和模型,如基于深度学习的ReID模型、多视角特征融合方法和遮挡处理技术等。例如,CUHK03数据集推动了深度学习在行人重识别中的应用,而PRID2011数据集则促进了多摄像头同步和轨迹匹配技术的研究。这些衍生工作不仅提升了行人重识别的准确性,也为相关领域的技术进步提供了重要参考。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

jpft/danbooru2023

Danbooru2023是一个大规模的动漫图像数据集,包含超过500万张由爱好者社区贡献并详细标注的图像。图像标签涵盖角色、场景、版权、艺术家等方面,平均每张图像有30个标签。该数据集可用于训练图像分类、多标签标注、角色检测、生成模型等多种计算机视觉任务。数据集基于danbooru2021构建,扩展至包含ID #6,857,737的图像,增加了超过180万张新图像,总大小约为8TB。图像以原始格式提供,分为1000个子目录,使用图像ID的模1000进行分桶,以避免文件系统性能问题。

hugging_face 收录

DALY

DALY数据集包含了全球疾病负担研究(Global Burden of Disease Study)中的伤残调整生命年(Disability-Adjusted Life Years, DALYs)数据。该数据集提供了不同国家和地区在不同年份的DALYs指标,用于衡量因疾病、伤害和早逝导致的健康损失。

ghdx.healthdata.org 收录