five

COCAS

收藏
arXiv2020-05-16 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2005.07862v1
下载链接
链接失效反馈
官方服务:
资源简介:
COCAS数据集是由中国科学院深圳先进技术研究院创建的一个大规模行人重识别基准数据集,专注于解决衣物变化下的识别问题。该数据集包含5,266个身份,共计62,382张身体图像,每个身份平均有12张图像,涵盖多种真实场景,如不同的光照和遮挡条件。数据集的构建过程复杂,涉及图像采集、人物与衣物关联等步骤,旨在通过提供同一人物不同衣物的图像,增强模型在实际应用中的识别能力,特别适用于追踪更换衣物的嫌疑人或寻找丢失的儿童和老人。

The COCAS dataset is a large-scale person re-identification benchmark dataset created by the Shenzhen Institute of Advanced Technology, Chinese Academy of Sciences, focusing on addressing the recognition problem under clothing variations. It contains 5,266 identities and a total of 62,382 body images, with an average of 12 images per identity, covering various real-world scenarios such as different lighting conditions and occlusion situations. The construction process of the dataset is complex, involving steps like image collection and the association between persons and their clothing. It aims to enhance the recognition capability of models in real-world applications by providing images of the same person wearing different garments, and is particularly suitable for tracking suspects who have changed their clothing or searching for missing children and elderly people.
提供机构:
中国科学院深圳先进技术研究院
创建时间:
2020-05-16
搜集汇总
数据集介绍
main_image_url
构建方式
在行人重识别领域,传统数据集假设同一身份的行人穿着相同服装,这限制了模型在现实换装场景下的应用。COCAS数据集的构建旨在填补这一空白,其采集过程在多个商品交易市场展开,通过部署30台摄像机在室内外不同光照条件下捕捉行人图像。数据收集历时四天,以增加捕捉同一行人更换服装的概率。核心构建挑战在于如何高效关联同一行人在不同服装下的图像。为此,研究团队设计了一套自动化与人工标注结合的流程:首先基于重识别特征对行人图像进行聚类并手动剔除异常值;随后从每个类簇中选择锚点图像进行人脸检测;接着利用FaceNet提取人脸特征并检索最相似的Top-K个锚点图像;最后通过人工可视化验证,确认并关联真正匹配的行人身份。对于每个确认的身份,选取其2至3套不同服装,每套服装包含2至5张图像,并依据服装类型将图像划分至查询集或图库集。
使用方法
COCAS数据集的使用遵循一套为换装重识别量身定制的协议。数据集按行人身份进行纵向划分,其中2,800个身份用于训练,其余2,466个身份用于测试。在测试阶段,进一步根据服装进行横向划分:从每个测试身份中,指定一套服装的所有图像作为图库集中的目标图像;其余服装的图像则与从互联网检索的、与该目标服装相似的服装模板图像一同构成查询集。因此,每次查询的输入是一个二元组:一张穿着服装A的行人图像(查询图像)和一张描述服装B的模板图像,目的是在图库中检索出穿着服装B的同一行人图像(目标图像)。评估指标采用累计匹配特性曲线和平均精度均值,以全面衡量检索性能。该设定模拟了寻找走失人员或追踪换装嫌疑人等实际应用场景,即提供一张近期照片和一件目标服装的描述。为应对此任务,论文提出了双分支生物特征-服装网络,分别提取行人生物特征和服装特征,并通过联合损失函数进行优化。
背景与挑战
背景概述
行人重识别技术作为智能视频监控系统的核心,长期以来依赖于行人着装不变的假设,这在银行抢劫、嫌疑人追踪等现实场景中存在显著局限。为应对这一挑战,中国科学院深圳先进技术研究院与商汤科技联合实验室于2020年构建了COCAS数据集,这是首个专注于跨着装行人重识别的大规模基准。该数据集包含5,266个身份共62,382张图像,每个身份平均拥有2-3套不同着装,通过30个摄像头在真实市场环境中采集,涵盖了室内外光照、不同程度遮挡等复杂条件。COCAS的诞生标志着行人重识别研究从静态着装范式向动态着装范式的关键转变,为跨着装身份匹配这一核心问题提供了首个系统性研究平台。
当前挑战
COCAS数据集主要面临双重挑战。在领域问题层面,跨着装行人重识别需解决生物特征与着装特征的解耦难题:传统模型过度依赖着装外观作为判别特征,而人脸、体型等生物特征在图像中占比小且易受姿态、遮挡干扰;同时,模型需在保留身份判别力的前提下,消除着装变化带来的特征干扰。在构建过程层面,数据采集面临现实约束:需在保护隐私前提下获取同一身份的多套着装图像,为此采用人脸模糊化处理,但这也削弱了关键生物特征;身份关联流程复杂,需结合重识别特征聚类、人脸检索与人工标注等多阶段方法,从海量无序图像中精准关联同一身份的不同着装图像,且需为每套着装匹配网络检索的服装模板图像,确保数据质量与规模平衡。
常用场景
经典使用场景
在行人重识别领域,传统研究假设个体在跨摄像头场景中衣着保持不变,然而现实监控中换装行为普遍存在。COCAS数据集通过提供同一身份在不同衣着下的多张图像,开创性地构建了换装行人重识别的研究基准。该数据集最经典的使用场景是评估和开发能够在衣着变化条件下仍能准确识别行人身份的算法模型,其核心任务在于利用查询图像中的生物特征与衣着模板的视觉信息,在候选图库中检索出同一身份的目标图像。
解决学术问题
COCAS数据集主要解决了行人重识别研究中长期被忽视的衣着变化难题。传统模型过度依赖衣着外观作为判别特征,当个体更换服装时性能急剧下降。该数据集通过引入包含生物特征图像和独立衣着模板的查询范式,促使研究社区探索衣着无关的身份特征提取方法。其意义在于将行人重识别从表观匹配推向本质身份识别,推动了对于人脸、体型、姿态等生物特征建模的深入研究,为构建更鲁棒、更实用的监控系统奠定了数据基础。
实际应用
该数据集的设计紧密贴合公共安全与社会服务的实际需求。在刑事侦查中,嫌疑人常通过更换衣物逃避追踪,COCAS支持的换装重识别技术可协助警方利用目击者描述的衣着模板和监控抓拍图像进行跨时段追踪。在民生领域,寻找走失的儿童或老人时,家属可提供走失者近期照片及其所穿衣物的图像,系统便能在大范围监控网络中检索换装后的目标。这些应用显著提升了视频监控系统在复杂现实场景中的实用价值与可靠性。
数据集最近研究
最新研究方向
在智能监控与公共安全领域,人物重识别技术正面临衣着变换带来的核心挑战。COCAS数据集作为首个大规模多衣着人物重识别基准,其前沿研究聚焦于跨衣着身份特征的解耦与融合。当前研究热点围绕多模态特征学习展开,通过构建双分支网络架构,分别提取生物特征(如体型、姿态)与衣着特征,并探索注意力机制在特征掩码中的应用,以抑制衣着干扰、增强身份判别性。这一方向对嫌疑犯追踪、走失人员搜寻等现实场景具有突破性意义,推动了重识别技术从静态衣着假设向动态现实环境的范式转移。
相关研究论文
  • 1
    COCAS: A Large-Scale Clothes Changing Person Dataset for Re-identification中国科学院深圳先进技术研究院 · 2020年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作