five

CHIRLA

收藏
Hugging Face2025-09-16 更新2025-09-17 收录
下载链接:
https://huggingface.co/datasets/bdager/CHIRLA
下载链接
链接失效反馈
官方服务:
资源简介:
CHIRLA(Comprehensive High-resolution Identification and Re-identification for Large-scale Analysis)是一个长期、多摄像头的行人重识别(Re-ID)和跟踪数据集。它跨越了7个月,7个摄像头,22个身份,以及大约1M个身份标注的边界框,分布在约596k帧中,在连接的室内环境中捕获。CHIRLA旨在解决长期外观变化(例如,几个月内的服装变化)和现实挑战,如遮挡和多摄像头交棒。原始数据包括多摄像头视频,具有身份注释和用于行人Re-ID和跟踪的基准划分。基准组织和元数据与Parquet清单一起存储在存储库中,这些清单引用了图像/注释,以便使用🤗 Datasets轻松加载。
创建时间:
2025-09-15
原始信息汇总

CHIRLA 数据集概述

数据集基本信息

  • 数据集名称:CHIRLA(Comprehensive High-resolution Identification and Re-identification for Large-scale Analysis)
  • 许可证:CC BY 4.0(Creative Commons Attribution 4.0)
  • 任务类别:图像特征提取
  • 语言:英语
  • 标签:重识别、跟踪、长期、多摄像头

数据集详情

CHIRLA 是一个长期、多摄像头人员重识别(Re-ID)和跟踪数据集,涵盖7个月时间、7个摄像头、22个身份,在约59.6万帧中包含约100万个身份标注边界框,采集于连接的室内环境。

关键统计指标

指标 数值
持续时间 7个月
个体数量 22个独特人员
摄像头数量 7个多视角摄像头
视频文件 70个序列
总帧数 596,345帧
标注数量 963,554个边界框
分辨率 1080×720像素
帧率 30 fps
环境 室内办公环境

数据集来源

  • GitHub仓库:https://github.com/bdager/CHIRLA
  • 论文:https://arxiv.org/abs/2502.06681

数据集用途

直接用途

  • 多摄像头和长期外观变化下的人员重识别研究
  • 室内多摄像头环境下的人员跟踪实验
  • 通过仓库中提供的元数据/清单进行人员重识别和跟踪的特定场景模型基准测试

超出范围用途

  • 未经明确同意或违反隐私或法律的任何用于监视、识别或监控真实人员的部署
  • 人口统计公平性或广泛泛化的声明:CHIRLA在特定室内空间仅有22个身份,不能代表全球人口统计或环境

数据集结构

仓库组织结构

CHIRLA/ ├── videos/ # 原始.mp4视频(Git LFS) ├── annotations/ # 每摄像头JSON标注文件 ├── benchmark/ # 按任务/场景/拆分组织的图像+JSON │ ├── reid/ │ ├── tracking/ │ └── metadata/ # 定义拆分的CSV(ReID:train/val/gallery/query;Tracking:train/test) └── manifests/ # 用于轻松加载的自动生成的Parquet表

清单列

  • image_path(仓库相对路径到帧/图像)
  • annotation_path(仓库相对JSON标注文件)
  • taskreidtracking
  • scenario(例如:long_termmulti_camerabrief_occlusionsmultiple_people_occlusions
  • role(ReID:trainvalgalleryquery;Tracking:traintest
  • splitsubset(适用时)、seqcamera
  • person_idframe_name

数据拆分

  • ReID:每个场景提供四个角色——trainvalgalleryquery
  • Tracking:场景使用train/test(无子集)

数据集创建

创建理由

用于评估基于视频的长期重识别鲁棒性——跨越数月和多个摄像头——反映人员外观随时间显著变化的真实部署情况。

数据收集和处理

数据集在西班牙阿利坎特大学机器人、视觉和智能系统研究组总部录制,使用七个战略放置的Reolink RLC-410W摄像头在典型办公环境中捕获视频,覆盖实验室、走廊和共享工作区等区域。

标注过程

数据处理采用半自动标注程序:

  1. 自动检测和跟踪:使用YOLOv8x检测视频帧中的个体并提取边界框;使用Deep SORT算法生成轨迹并为检测到的个体分配唯一ID
  2. 手动验证和校正:开发专用图形用户界面进行手动验证和校正;手动验证边界框和ID在不同摄像头和序列间的一致性;所有标注经过彻底手动审查以确保准确性

加载数据集

快速开始(轻量级)

使用🤗 Datasets加载基准测试(仅清单/拆分,不下载所有.mp4视频)

python from datasets import load_dataset reid_lt = load_dataset("bdager/CHIRLA")

下载完整数据集(包括视频)

  • 选项A:使用Git LFS克隆(推荐本地工作)
  • 选项B:程序化下载

通过load_dataset获取所有视频

使用videos_all配置通过🤗 Datasets缓存所有视频

python from datasets import load_dataset vids = load_dataset("bdager/CHIRLA", "videos_all")

引用信息

BibTeX:

@article{dominguez2025chirla, title = {CHIRLA: Comprehensive High-resolution Identification and Re-identification for Large-scale Analysis}, author = {Domínguez-Dager, Bessie and Escalona, Felix and Gomez-Donoso, Francisco and Cazorla, Miguel}, journal = {arXiv preprint arXiv:2502.06681}, year = {2025} }

APA: Domínguez-Dager, B., Escalona, F., Gómez-Donoso, F., & Cazorla, M. (2025). CHIRLA: Comprehensive High-resolution Identification and Re-identification for Large-scale Analysis (arXiv:2502.06681). arXiv.

联系方式

如有任何问题或支持,请联系 bessie.dominguez@ua.es 或在GitHub仓库中提出问题:https://github.com/bdager/CHIRLA/issues

搜集汇总
数据集介绍
main_image_url
构建方式
在计算机视觉领域,长期人员重识别研究亟需高质量数据集支撑。CHIRLA数据集通过七台Reolink RLC-410W摄像机在西班牙阿利坎特大学办公环境中持续采集七个月视频数据,采用YOLOv8x进行目标检测与Deep SORT算法跟踪生成初始标注,随后通过定制化图形界面工具进行人工校验与身份一致性修正,最终形成包含22个身份、约59.6万帧图像和96.3万标注边界框的多视角数据集。
特点
该数据集显著特征体现在其时间跨度与场景复杂性方面。涵盖七个月周期内人员外观自然变化(如服装更替),提供七台摄像机在四个连通室内空间的多视角数据,包含短暂遮挡、多人交互等现实挑战场景。数据集采用分级组织架构,通过Parquet清单文件实现高效数据索引,并针对重识别与跟踪任务分别提供标准化的训练、验证、画廊和查询集划分。
使用方法
研究人员可通过HuggingFace Datasets库快速加载基准清单文件,使用bdager/CHIRLA标识符访问不同任务配置。对于完整视频数据,支持Git LFS克隆或程序化下载方式获取原始MP4文件。数据集提供多场景加载接口,包括长期重识别(reid_long_term)、多摄像机重识别(reid_multi_camera)及不同复杂度的跟踪任务配置,每个数据条目包含图像路径、标注文件路径、摄像机编号、人员ID等元信息字段。
背景与挑战
背景概述
CHIRLA数据集由阿利坎特大学机器人、视觉与智能系统研究团队于2025年创建,旨在解决长期多摄像头场景下的行人重识别与追踪问题。该数据集通过七个月跨度的连续采集,涵盖22个身份在7个摄像头下的百万级标注边界框,聚焦于服装变化、环境遮挡等现实挑战,为计算机视觉领域提供了首个针对长期外观变化的基准数据资源。
当前挑战
该数据集核心挑战在于解决长期跨摄像头行人重识别中因服装更换、光照变化和遮挡导致的特征一致性难题。构建过程中需克服多设备同步采集、海量数据标注校验等技术瓶颈,同时需确保身份标注在数月跨度中的准确性,这对半自动标注流程的质量控制提出了极高要求。
常用场景
经典使用场景
在计算机视觉领域,CHIRLA数据集为长期人员重识别研究提供了关键实验平台。该数据集通过跨越7个月的多摄像头监控序列,捕捉了22个目标在室内办公环境中的外观变化轨迹,包括服装更换、光照条件变化和姿态多样性等复杂因素。研究者可利用其精心设计的基准任务,如长期重识别和多摄像头追踪,评估模型在真实场景下的跨时间跨空间识别能力。
解决学术问题
CHIRLA有效解决了长期人员重识别中的核心学术挑战。其包含的963,554个标注边界框和596,345帧视频数据,为研究社区提供了应对外观长期演变、跨摄像头视角差异和复杂遮挡问题的标准化测试环境。该数据集通过严谨的时间跨度设计和多场景划分,推动了针对动态外观建模、跨模态特征对齐和时空一致性保持等关键问题的算法创新。
衍生相关工作
基于CHIRLA数据集已衍生出多项重要研究工作,包括针对长期外观变化的特征解耦算法、跨摄像头时空关联模型,以及应对服装变更的语义一致性学习框架。这些工作显著推进了行人重识别领域的技术边界,其中部分成果通过结合时序建模和注意力机制,实现了在复杂环境下的稳健身份保持,为后续研究设立了新的性能基准。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作