five

Market-1501

收藏
github2024-07-02 更新2024-07-09 收录
下载链接:
https://github.com/owenstrength/Person-ReID
下载链接
链接失效反馈
官方服务:
资源简介:
Market-1501数据集包含32,668个标注的边界框,涉及1,501个身份。图像来自6个不同的摄像头,其中5个为高分辨率摄像头,1个为低分辨率摄像头。数据集分为训练集和测试集。

The Market-1501 dataset contains 32,668 annotated bounding boxes covering 1,501 identities. The images are captured by 6 distinct cameras, among which 5 are high-resolution cameras and 1 is a low-resolution camera. The dataset is split into a training set and a test set.
创建时间:
2024-06-29
原始信息汇总

人员重识别使用ResNet18在Market-1501数据集上

项目概述

本项目使用修改后的ResNet18架构在Market-1501数据集上实现人员重识别(ReID)系统。目标是准确识别和匹配多摄像头监控系统中多个非重叠摄像头视图中的个体。

关键特性

  • 模型架构:修改后的ResNet18主干网络
  • 数据集:Market-1501
  • 评估指标:平均精度均值(mAP),累积匹配特征(CMC)
  • 损失函数:带标签平滑的交叉熵损失

数据集

Market-1501数据集包含1,501个身份的32,668个带注释的边界框。图像从6个不同的摄像头捕获,其中5个高分辨率摄像头和1个低分辨率摄像头。数据集分为训练集和测试集。

方法论

模型架构

我们使用修改后的ResNet18作为主干网络。最后的完全连接层被新的嵌入层和分类层替换。这使得网络能够学习用于人员重识别的判别特征,同时保持相对轻量级的架构。

训练过程

  1. 数据预处理:图像被调整为256x128像素并进行归一化。
  2. 数据增强:在训练过程中应用随机水平翻转和颜色抖动。
  3. 优化:Adam优化器,学习率为0.001,权重衰减为5e-4。
  4. 学习率调度:步长衰减,每20个周期学习率减少0.1倍。

损失函数

我们采用带标签平滑的交叉熵损失。标签平滑有助于防止模型变得过于自信并提高泛化能力。损失函数定义如下:

python class CrossEntropyLabelSmooth(nn.Module): def init(self, num_classes, epsilon=0.1): super(CrossEntropyLabelSmooth, self).init() self.num_classes = num_classes self.epsilon = epsilon self.logsoftmax = nn.LogSoftmax(dim=1)

def forward(self, inputs, targets):
    log_probs = self.logsoftmax(inputs)
    targets = torch.zeros_like(log_probs).scatter_(1, targets.unsqueeze(1), 1)
    targets = (1 - self.epsilon) * targets + self.epsilon / self.num_classes
    loss = (-targets * log_probs).mean(0).sum()
    return loss

该损失函数在所有类别中均匀分配一个小概率(ε),有助于减少过拟合并提高模型的泛化能力。

结果

经过训练,我们的模型在测试集上取得了以下性能:

  • mAP(平均精度均值):0.7837
  • Rank-1准确率(CMC@1):0.9348
  • Rank-5准确率(CMC@5):0.9825
  • Rank-10准确率(CMC@10):0.9903

这些结果表明模型性能强劲,模型在top-1匹配中正确识别同一个人的准确率为93.48%,在top-5匹配中准确率为98.25%。

结论

本项目展示了修改后的ResNet18架构在Market-1501数据集上进行人员重识别的有效性。损失函数中使用标签平滑和仔细的数据预处理有助于在保持相对轻量级模型架构的同时实现有竞争力的结果。

未来工作

  • 尝试更高级的架构,如ResNet50或DenseNet
  • 实现三元组损失或其他度量学习方法
  • 探索注意力机制,专注于人的判别部分
  • 研究跨数据集泛化的域适应技术
搜集汇总
数据集介绍
main_image_url
构建方式
Market-1501数据集由32,668个标注的边界框组成,涵盖了1,501个不同的身份。这些图像采集自6个不同的摄像头,其中5个为高分辨率摄像头,1个为低分辨率摄像头。数据集被划分为训练集和测试集,以确保模型的泛化能力。通过这种多摄像头、多分辨率的设置,数据集有效地模拟了实际监控环境中的复杂性,为行人重识别任务提供了丰富的训练和评估资源。
特点
Market-1501数据集的显著特点在于其多样性和复杂性。首先,数据集包含了来自不同摄像头的图像,涵盖了多种视角和分辨率,这使得模型能够学习到在不同环境下的行人特征。其次,数据集的标注精细,每个身份都有多个视角的图像,这有助于模型在实际应用中更准确地匹配行人。此外,数据集的划分合理,确保了训练和测试数据之间的独立性,从而能够有效评估模型的性能。
使用方法
使用Market-1501数据集进行行人重识别任务时,首先需要对图像进行预处理,包括调整大小和归一化处理。随后,可以采用数据增强技术,如随机水平翻转和颜色抖动,以增加训练数据的多样性。模型训练过程中,推荐使用Adam优化器,并结合学习率衰减策略,以提高模型的收敛速度和性能。最终,通过计算平均精度均值(mAP)和累积匹配特征(CMC)等指标,可以全面评估模型的表现。
背景与挑战
背景概述
Market-1501数据集是由Zheng等人于2015年创建,旨在为行人重识别(Person Re-Identification, ReID)领域提供一个标准化的基准。该数据集包含了32,668个标注的边界框,涵盖了1,501个不同的身份,这些图像从6个不同的摄像头中采集,其中5个为高分辨率摄像头,1个为低分辨率摄像头。Market-1501的创建极大地推动了行人重识别技术的发展,为研究人员提供了一个丰富的数据资源,以评估和改进他们的算法。
当前挑战
Market-1501数据集在行人重识别领域面临的主要挑战包括:1) 跨摄像头视角和分辨率的差异,这增加了特征提取和匹配的难度;2) 数据集中存在的光照变化、姿态变化和遮挡问题,这些因素都可能影响模型的识别准确性;3) 数据集的构建过程中,如何确保标注的准确性和一致性也是一个重要的挑战。此外,尽管Market-1501在行人重识别领域取得了显著进展,但如何进一步提高模型的泛化能力和跨数据集的适应性仍是当前研究的重点。
常用场景
经典使用场景
Market-1501数据集在行人重识别(Person Re-Identification, ReID)领域中被广泛应用,其经典使用场景包括在多摄像头监控系统中准确识别和匹配不同摄像头视角下的同一行人。通过使用修改后的ResNet18架构,该数据集能够有效训练模型,使其在多个非重叠摄像头视图中识别出相同的个体。
解决学术问题
Market-1501数据集解决了行人重识别领域中的关键学术问题,如跨摄像头视角下的行人匹配和身份识别。该数据集通过提供大量标注的行人图像,帮助研究人员开发和验证新的算法,从而提高识别精度和鲁棒性。其意义在于推动了行人重识别技术的发展,为实际应用提供了理论和实验基础。
衍生相关工作
基于Market-1501数据集,许多相关研究工作得以展开,包括但不限于改进的深度学习模型、多任务学习方法以及跨域适应技术。例如,研究人员尝试使用更高级的网络架构如ResNet50或DenseNet,以及引入三元组损失或注意力机制来进一步提升行人重识别的性能。这些衍生工作不仅丰富了行人重识别领域的研究内容,还推动了相关技术的实际应用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作