VIPeR, ETH1,2,3, QMUL iLIDS, GRID, CAVIAR4ReID, 3DPeS, PRID2011, V47, WARD, SAIVT-Softbio, CUHK01, CUHK02, CUHK03|人重新识别数据集|计算机视觉数据集
收藏数据集概述
本数据集页面收集了所有公开的用于人员再识别(Person Re-Identification)算法测试的数据集。以下是各数据集的关键信息概览:
数据集列表
数据集 | 发布时间 | 身份数量 | 摄像头数量 | 图像数量 | 标签方法 | 裁剪尺寸 | 多镜头 | 跟踪序列 | 全帧可用性 |
---|---|---|---|---|---|---|---|---|---|
VIPeR | 2007 | 632 | 2 | 1264 | 手工 | 128X48 | |||
ETH1,2,3 | 2007 | 85, 35, 28 | 1 | 8580 | 手工 | 变化 | ✔ | ✔ | ✔ |
QMUL iLIDS | 2009 | 119 | 2 | 476 | 手工 | 变化 | ✔ | ||
GRID | 2009 | 1025 | 8 | 1275 | 手工 | 变化 | |||
CAVIAR4ReID | 2011 | 72 | 2 | 1220 | 手工 | 变化 | ✔ | ||
3DPeS | 2011 | 192 | 8 | 1011 | 手工 | 变化 | ✔ | ✔* | |
PRID2011 | 2011 | 934 | 2 | 24541 | 手工 | 128X64 | ✔ | ✔ | ✔* |
V47 | 2011 | 47 | 2 | 752 | 手工 | 变化 | ✔ | ✔ | |
WARD | 2012 | 70 | 3 | 4786 | 手工 | 128X48 | ✔ | ✔ | |
SAIVT-Softbio | 2012 | 152 | 8 | 64472 | 手工 | 变化 | ✔ | ✔ | ✔ |
CUHK01 | 2012 | 971 | 2 | 3884 | 手工 | 160X60 | ✔ | ||
CUHK02 | 2013 | 1816 | 10(5 pairs) | 7264 | 手工 | 160X60 | ✔ | ||
CUHK03 | 2014 | 1467 | 10(5 pairs) | 13164 | 手工/DPM | 变化 | ✔ | ||
RAiD | 2014 | 43 | 4 | 6920 | 手工 | 128X64 | ✔ | ||
iLIDS-VID | 2014 | 300 | 2 | 42495 | 手工 | 变化 | ✔ | ✔ | |
MPR Drone | 2014 | 84 | 1 | 金字塔特征(ACF) | 变化 | ✔ | ✔ | ||
HDA Person Dataset | 2014 | 53 | 13 | 2976 | 手工/金字塔特征(ACF) | 变化 | ✔ | ✔ | ✔ |
Shinpuhkan Dataset | 2014 | 24 | 16 | 手工 | 128X48 | ✔ | ✔ | ||
CASIA Gait Database B | 2015 | 124 | 11 | 背景减法 | 变化 | ✔ | ✔ | ✔ | |
Market1501 | 2015 | 1501 | 6 | 32217 | 手工/DPM | 128X64 | ✔ | ||
PKU-Reid | 2016 | 114 | 2 | 1824 | 手工 | 128X64 | |||
PRW | 2016 | 932 | 6 | 34304 | 手工 | 变化 | ✔ | ✔ | |
Large scale person search | 2016 | 11934s | - | 34574 | 手工 | 变化 | ✔ | ||
MARS | 2016 | 1261 | 6 | 1191003 | DPM+GMMCP | 256X128 | ✔ | ✔ | |
DukeMTMC-reID | 2017 | 1812 | 8 | 36441 | 手工 | 变化 | ✔ | ✔ | |
DukeMTMC4ReID | 2017 | 1852 | 8 | 46261 | Doppia | 变化 | ✔ | ✔ | |
Airport | 2017 | 9651 | 6 | 39902 | ACF | 128X64 | ✔ | ||
MSMT17 | 2018 | 4101 | 15 | 126441 | Faster RCNN | 变化 | ✔ | ||
RPIfield | 2018 | 112 | 12 | 601,581 | ACF | 变化 | ✔ | ✔ | |
LPW | 2018 | 2,731 | 3,4,4 | 592,438 | Detector+NN+Hand | - | ✔ | ✔ | |
PKU SketchRe-ID | 2018 | 200 | 2 | 400 | 手工 | - | |||
ThermalWorld | 2018 | 516 | 20 | 15,118 | 手工 | - | |||
SoccerNet-ReID | 2022 | 243,432 | - | 340,993 | 手工 | 变化 | ✔ | ||
DeepSportradar-ReID | 2022 | 486 | - | 9529 | 手工 | 变化 | ✔ | ||
LaST | 2022 | 10862 | - | 228k | Detector+Hand | 变化 | |||
MALS | 2023 | 1,510,330 | 合成 | 1,510,330 | BLIP | 变化 |
数据集详情
- VIPeR: 包含两个摄像头,每个摄像头捕捉一个人的图像,提供视角角度。
- ETH1,2,3: 收集自移动摄像头,具有较大的光照和尺度变化。
- QMUL iLIDS: 基于机场繁忙时间的CCTV系统数据,具有重遮挡和姿态变化。
- GRID: 由8个非重叠摄像头在繁忙的地下车站收集。
- CAVIAR4ReID: 从购物中心的两个监控摄像头提取,具有视场重叠。
- 3DPeS: 由8个非重叠户外摄像头收集,提供3D环境和摄像头校准数据。
- PRID2011: 包含385个摄像头A的轨迹和749个摄像头B的轨迹,仅有200人在两个摄像头中都出现。
- V47: 使用两个室内摄像头收集,每个身份在不同方向上被捕捉。
- WARD: 由三个非重叠摄像头收集,每个身份在每个摄像头中有多张图像。
- SAIVT-Softbio: 由八个现有监控摄像头收集,提供全视频帧和标记的边界框。
- CUHK01: 包含每个身份在每个摄像头中的两张图像,图像质量相对较好。
- CUHK02: 是CUHK01的扩展,增加了四个额外的摄像头对设置。
- CUHK03: 第一个足够大的深度学习人员再识别数据集,提供DPM检测和手工标记的边界框。
- RAiD: 每个身份在所有四个非重叠摄像头中都有图像,光照变化大。
- iLIDS-VID: 从iLIDS MCTS数据集中提取600个轨迹,具有极重的遮挡。
- MPR Drone: 由飞行无人机在室内外环境中收集,使用金字塔特征检测。
- HDA Person Dataset: 旨在尽可能接近真实的人员再识别系统,提供紧密的边界框和遮挡标志。
- Shinpuhkan Dataset: 最初用于测试多摄像头跟踪方法,每个身份有多个跟踪片段。
- CASIA Gait Database B: 最初用于测试步态识别算法,由11个重叠摄像头收集,提供原始视频帧和轮廓。
- Market1501: 提供DPM检测和手工标记的边界框,用于深度学习。
- PKU-Reid: 由两个摄像头收集,每个身份有两张图像。
- PRW: 由六个摄像头收集,每个身份有多张图像,图像质量变化。
- Large scale person search: 用于大规模人员搜索,全帧可用。
- MARS: 提供DPM+GMMCP标记,用于深度学习。
- DukeMTMC-reID: 由八个摄像头收集,每个身份有多张图像。
- DukeMTMC4ReID: 使用Doppia标记,每个身份有多张图像。
- Airport: 使用ACF标记,每个身份有多张图像。
- MSMT17: 使用Faster RCNN标记,用于深度学习。
- RPIfield: 由12个摄像头收集,每个身份有多张图像。
- LPW: 使用Detector+NN+Hand标记,每个身份有多张图像。
- PKU SketchRe-ID: 由两个摄像头收集,每个身份有两张图像。
- ThermalWorld: 由20个摄像头收集,每个身份有多张图像。
- SoccerNet-ReID: 用于足球场景中的人员再识别,全帧可用。
- DeepSportradar-ReID: 用于体育场景中的人员再识别,每个身份有多张图像。
- LaST: 使用Detector+Hand标记,用于深度学习。
- MALS: 使用BLIP标记,每个身份有多张图像。
以上数据集为人员再识别领域的研究提供了丰富的资源和多样化的场景,有助于推动该领域的技术发展。

中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录
中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录
FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录
jpft/danbooru2023
Danbooru2023是一个大规模的动漫图像数据集,包含超过500万张由爱好者社区贡献并详细标注的图像。图像标签涵盖角色、场景、版权、艺术家等方面,平均每张图像有30个标签。该数据集可用于训练图像分类、多标签标注、角色检测、生成模型等多种计算机视觉任务。数据集基于danbooru2021构建,扩展至包含ID #6,857,737的图像,增加了超过180万张新图像,总大小约为8TB。图像以原始格式提供,分为1000个子目录,使用图像ID的模1000进行分桶,以避免文件系统性能问题。
hugging_face 收录
DALY
DALY数据集包含了全球疾病负担研究(Global Burden of Disease Study)中的伤残调整生命年(Disability-Adjusted Life Years, DALYs)数据。该数据集提供了不同国家和地区在不同年份的DALYs指标,用于衡量因疾病、伤害和早逝导致的健康损失。
ghdx.healthdata.org 收录