CHIRLA
收藏CHIRLA 数据集概述
数据集基本信息
- 数据集名称:CHIRLA(Comprehensive High-resolution Identification and Re-identification for Large-scale Analysis)
- 许可证:CC BY 4.0(Creative Commons Attribution 4.0)
- 任务类别:图像特征提取
- 语言:英语
- 标签:重识别、跟踪、长期、多摄像头
数据集详情
CHIRLA 是一个长期、多摄像头人员重识别(Re-ID)和跟踪数据集,涵盖7个月时间、7个摄像头、22个身份,在约59.6万帧中包含约100万个身份标注边界框,采集于连接的室内环境。
关键统计指标
| 指标 | 数值 |
|---|---|
| 持续时间 | 7个月 |
| 个体数量 | 22个独特人员 |
| 摄像头数量 | 7个多视角摄像头 |
| 视频文件 | 70个序列 |
| 总帧数 | 596,345帧 |
| 标注数量 | 963,554个边界框 |
| 分辨率 | 1080×720像素 |
| 帧率 | 30 fps |
| 环境 | 室内办公环境 |
数据集来源
- GitHub仓库:https://github.com/bdager/CHIRLA
- 论文:https://arxiv.org/abs/2502.06681
数据集用途
直接用途
- 多摄像头和长期外观变化下的人员重识别研究
- 室内多摄像头环境下的人员跟踪实验
- 通过仓库中提供的元数据/清单进行人员重识别和跟踪的特定场景模型基准测试
超出范围用途
- 未经明确同意或违反隐私或法律的任何用于监视、识别或监控真实人员的部署
- 人口统计公平性或广泛泛化的声明:CHIRLA在特定室内空间仅有22个身份,不能代表全球人口统计或环境
数据集结构
仓库组织结构
CHIRLA/ ├── videos/ # 原始.mp4视频(Git LFS) ├── annotations/ # 每摄像头JSON标注文件 ├── benchmark/ # 按任务/场景/拆分组织的图像+JSON │ ├── reid/ │ ├── tracking/ │ └── metadata/ # 定义拆分的CSV(ReID:train/val/gallery/query;Tracking:train/test) └── manifests/ # 用于轻松加载的自动生成的Parquet表
清单列
image_path(仓库相对路径到帧/图像)annotation_path(仓库相对JSON标注文件)task(reid、tracking)scenario(例如:long_term、multi_camera、brief_occlusions、multiple_people_occlusions)role(ReID:train、val、gallery、query;Tracking:train、test)split、subset(适用时)、seq、cameraperson_id、frame_name
数据拆分
- ReID:每个场景提供四个角色——
train、val、gallery、query - Tracking:场景使用
train/test(无子集)
数据集创建
创建理由
用于评估基于视频的长期重识别鲁棒性——跨越数月和多个摄像头——反映人员外观随时间显著变化的真实部署情况。
数据收集和处理
数据集在西班牙阿利坎特大学机器人、视觉和智能系统研究组总部录制,使用七个战略放置的Reolink RLC-410W摄像头在典型办公环境中捕获视频,覆盖实验室、走廊和共享工作区等区域。
标注过程
数据处理采用半自动标注程序:
- 自动检测和跟踪:使用YOLOv8x检测视频帧中的个体并提取边界框;使用Deep SORT算法生成轨迹并为检测到的个体分配唯一ID
- 手动验证和校正:开发专用图形用户界面进行手动验证和校正;手动验证边界框和ID在不同摄像头和序列间的一致性;所有标注经过彻底手动审查以确保准确性
加载数据集
快速开始(轻量级)
使用🤗 Datasets加载基准测试(仅清单/拆分,不下载所有.mp4视频)
python from datasets import load_dataset reid_lt = load_dataset("bdager/CHIRLA")
下载完整数据集(包括视频)
- 选项A:使用Git LFS克隆(推荐本地工作)
- 选项B:程序化下载
通过load_dataset获取所有视频
使用videos_all配置通过🤗 Datasets缓存所有视频
python from datasets import load_dataset vids = load_dataset("bdager/CHIRLA", "videos_all")
引用信息
BibTeX:
@article{dominguez2025chirla, title = {CHIRLA: Comprehensive High-resolution Identification and Re-identification for Large-scale Analysis}, author = {Domínguez-Dager, Bessie and Escalona, Felix and Gomez-Donoso, Francisco and Cazorla, Miguel}, journal = {arXiv preprint arXiv:2502.06681}, year = {2025} }
APA: Domínguez-Dager, B., Escalona, F., Gómez-Donoso, F., & Cazorla, M. (2025). CHIRLA: Comprehensive High-resolution Identification and Re-identification for Large-scale Analysis (arXiv:2502.06681). arXiv.
联系方式
如有任何问题或支持,请联系 bessie.dominguez@ua.es 或在GitHub仓库中提出问题:https://github.com/bdager/CHIRLA/issues




