CHIRLA

Hugging Face2025-09-16 更新2025-09-17 收录

下载链接：

https://huggingface.co/datasets/bdager/CHIRLA

下载链接

链接失效反馈

官方服务：

资源简介：

CHIRLA（Comprehensive High-resolution Identification and Re-identification for Large-scale Analysis）是一个长期、多摄像头的行人重识别（Re-ID）和跟踪数据集。它跨越了7个月，7个摄像头，22个身份，以及大约1M个身份标注的边界框，分布在约596k帧中，在连接的室内环境中捕获。CHIRLA旨在解决长期外观变化（例如，几个月内的服装变化）和现实挑战，如遮挡和多摄像头交棒。原始数据包括多摄像头视频，具有身份注释和用于行人Re-ID和跟踪的基准划分。基准组织和元数据与Parquet清单一起存储在存储库中，这些清单引用了图像/注释，以便使用🤗 Datasets轻松加载。

创建时间：

2025-09-15

原始信息汇总

CHIRLA 数据集概述

数据集基本信息

数据集名称：CHIRLA（Comprehensive High-resolution Identification and Re-identification for Large-scale Analysis）
许可证：CC BY 4.0（Creative Commons Attribution 4.0）
任务类别：图像特征提取
语言：英语
标签：重识别、跟踪、长期、多摄像头

数据集详情

CHIRLA 是一个长期、多摄像头人员重识别（Re-ID）和跟踪数据集，涵盖7个月时间、7个摄像头、22个身份，在约59.6万帧中包含约100万个身份标注边界框，采集于连接的室内环境。

关键统计指标

指标	数值
持续时间	7个月
个体数量	22个独特人员
摄像头数量	7个多视角摄像头
视频文件	70个序列
总帧数	596,345帧
标注数量	963,554个边界框
分辨率	1080×720像素
帧率	30 fps
环境	室内办公环境

数据集来源

GitHub仓库：https://github.com/bdager/CHIRLA
论文：https://arxiv.org/abs/2502.06681

数据集用途

直接用途

多摄像头和长期外观变化下的人员重识别研究
室内多摄像头环境下的人员跟踪实验
通过仓库中提供的元数据/清单进行人员重识别和跟踪的特定场景模型基准测试

超出范围用途

未经明确同意或违反隐私或法律的任何用于监视、识别或监控真实人员的部署
人口统计公平性或广泛泛化的声明：CHIRLA在特定室内空间仅有22个身份，不能代表全球人口统计或环境

数据集结构

仓库组织结构

CHIRLA/ ├── videos/ # 原始.mp4视频（Git LFS） ├── annotations/ # 每摄像头JSON标注文件 ├── benchmark/ # 按任务/场景/拆分组织的图像+JSON │ ├── reid/ │ ├── tracking/ │ └── metadata/ # 定义拆分的CSV（ReID：train/val/gallery/query；Tracking：train/test） └── manifests/ # 用于轻松加载的自动生成的Parquet表

清单列

image_path（仓库相对路径到帧/图像）
annotation_path（仓库相对JSON标注文件）
task（reid、tracking）
scenario（例如：long_term、multi_camera、brief_occlusions、multiple_people_occlusions）
role（ReID：train、val、gallery、query；Tracking：train、test）
split、subset（适用时）、seq、camera
person_id、frame_name

数据拆分

ReID：每个场景提供四个角色——train、val、gallery、query
Tracking：场景使用train/test（无子集）

数据集创建

创建理由

用于评估基于视频的长期重识别鲁棒性——跨越数月和多个摄像头——反映人员外观随时间显著变化的真实部署情况。

数据收集和处理

数据集在西班牙阿利坎特大学机器人、视觉和智能系统研究组总部录制，使用七个战略放置的Reolink RLC-410W摄像头在典型办公环境中捕获视频，覆盖实验室、走廊和共享工作区等区域。

标注过程

数据处理采用半自动标注程序：

自动检测和跟踪：使用YOLOv8x检测视频帧中的个体并提取边界框；使用Deep SORT算法生成轨迹并为检测到的个体分配唯一ID
手动验证和校正：开发专用图形用户界面进行手动验证和校正；手动验证边界框和ID在不同摄像头和序列间的一致性；所有标注经过彻底手动审查以确保准确性

加载数据集

快速开始（轻量级）

使用🤗 Datasets加载基准测试（仅清单/拆分，不下载所有.mp4视频）

python from datasets import load_dataset reid_lt = load_dataset("bdager/CHIRLA")

下载完整数据集（包括视频）

选项A：使用Git LFS克隆（推荐本地工作）
选项B：程序化下载

通过`load_dataset`获取所有视频

使用videos_all配置通过🤗 Datasets缓存所有视频

python from datasets import load_dataset vids = load_dataset("bdager/CHIRLA", "videos_all")

引用信息

BibTeX:

@article{dominguez2025chirla, title = {CHIRLA: Comprehensive High-resolution Identification and Re-identification for Large-scale Analysis}, author = {Domínguez-Dager, Bessie and Escalona, Felix and Gomez-Donoso, Francisco and Cazorla, Miguel}, journal = {arXiv preprint arXiv:2502.06681}, year = {2025} }

APA: Domínguez-Dager, B., Escalona, F., Gómez-Donoso, F., & Cazorla, M. (2025). CHIRLA: Comprehensive High-resolution Identification and Re-identification for Large-scale Analysis (arXiv:2502.06681). arXiv.

联系方式

如有任何问题或支持，请联系 bessie.dominguez@ua.es 或在GitHub仓库中提出问题：https://github.com/bdager/CHIRLA/issues

搜集汇总

数据集介绍

构建方式

在计算机视觉领域，长期人员重识别研究亟需高质量数据集支撑。CHIRLA数据集通过七台Reolink RLC-410W摄像机在西班牙阿利坎特大学办公环境中持续采集七个月视频数据，采用YOLOv8x进行目标检测与Deep SORT算法跟踪生成初始标注，随后通过定制化图形界面工具进行人工校验与身份一致性修正，最终形成包含22个身份、约59.6万帧图像和96.3万标注边界框的多视角数据集。

特点

该数据集显著特征体现在其时间跨度与场景复杂性方面。涵盖七个月周期内人员外观自然变化（如服装更替），提供七台摄像机在四个连通室内空间的多视角数据，包含短暂遮挡、多人交互等现实挑战场景。数据集采用分级组织架构，通过Parquet清单文件实现高效数据索引，并针对重识别与跟踪任务分别提供标准化的训练、验证、画廊和查询集划分。

使用方法

研究人员可通过HuggingFace Datasets库快速加载基准清单文件，使用bdager/CHIRLA标识符访问不同任务配置。对于完整视频数据，支持Git LFS克隆或程序化下载方式获取原始MP4文件。数据集提供多场景加载接口，包括长期重识别（reid_long_term）、多摄像机重识别（reid_multi_camera）及不同复杂度的跟踪任务配置，每个数据条目包含图像路径、标注文件路径、摄像机编号、人员ID等元信息字段。

背景与挑战

背景概述

CHIRLA数据集由阿利坎特大学机器人、视觉与智能系统研究团队于2025年创建，旨在解决长期多摄像头场景下的行人重识别与追踪问题。该数据集通过七个月跨度的连续采集，涵盖22个身份在7个摄像头下的百万级标注边界框，聚焦于服装变化、环境遮挡等现实挑战，为计算机视觉领域提供了首个针对长期外观变化的基准数据资源。

当前挑战

该数据集核心挑战在于解决长期跨摄像头行人重识别中因服装更换、光照变化和遮挡导致的特征一致性难题。构建过程中需克服多设备同步采集、海量数据标注校验等技术瓶颈，同时需确保身份标注在数月跨度中的准确性，这对半自动标注流程的质量控制提出了极高要求。

常用场景

经典使用场景

在计算机视觉领域，CHIRLA数据集为长期人员重识别研究提供了关键实验平台。该数据集通过跨越7个月的多摄像头监控序列，捕捉了22个目标在室内办公环境中的外观变化轨迹，包括服装更换、光照条件变化和姿态多样性等复杂因素。研究者可利用其精心设计的基准任务，如长期重识别和多摄像头追踪，评估模型在真实场景下的跨时间跨空间识别能力。

解决学术问题

CHIRLA有效解决了长期人员重识别中的核心学术挑战。其包含的963,554个标注边界框和596,345帧视频数据，为研究社区提供了应对外观长期演变、跨摄像头视角差异和复杂遮挡问题的标准化测试环境。该数据集通过严谨的时间跨度设计和多场景划分，推动了针对动态外观建模、跨模态特征对齐和时空一致性保持等关键问题的算法创新。

衍生相关工作

基于CHIRLA数据集已衍生出多项重要研究工作，包括针对长期外观变化的特征解耦算法、跨摄像头时空关联模型，以及应对服装变更的语义一致性学习框架。这些工作显著推进了行人重识别领域的技术边界，其中部分成果通过结合时序建模和注意力机制，实现了在复杂环境下的稳健身份保持，为后续研究设立了新的性能基准。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集