Cchead

Name: Cchead
Creator: 清华大学自动化系，新加坡国立大学设计与工程学院建筑环境系，武汉理工大学智能交通系统研究中心
Published: 2024-08-12 08:21:36
License: 暂无描述

arXiv2024-08-12 更新2024-08-14 收录

下载链接：

http://arxiv.org/abs/2408.05877v1

下载链接

链接失效反馈

官方服务：

资源简介：

Cchead数据集由清华大学、新加坡国立大学和武汉理工大学联合创建，专注于密集场景下的行人头部跟踪。该数据集包含50,528帧视频，标注了超过2,366,249个头部和2,358条轨迹，涵盖10种不同场景。数据集的创建过程包括手动标注和使用工具如Darklabel和CVAT进行辅助。Cchead数据集的应用领域主要集中在自动驾驶、机器人导航和行人流量监控等，旨在解决高密度人群中行人头部检测和跟踪的挑战。

The Cchead dataset, jointly created by Tsinghua University, National University of Singapore and Wuhan University of Technology, focuses on pedestrian head tracking in dense scenarios. This dataset contains 50,528 video frames, with annotations for over 2,366,249 heads and 2,358 tracks, covering 10 distinct scenarios. The dataset construction process includes manual annotation and auxiliary tools such as Darklabel and CVAT. The primary application areas of the Cchead dataset are autonomous driving, robot navigation, pedestrian flow monitoring and other related fields, aiming to address the challenges of pedestrian head detection and tracking in high-density crowds.

提供机构：

清华大学自动化系，新加坡国立大学设计与工程学院建筑环境系，武汉理工大学智能交通系统研究中心

创建时间：

2024-08-12

搜集汇总

数据集介绍

构建方式

Cchead数据集的构建方式是在武汉理工大学、保定科技园区等地拍摄了10个场景的视频，包括自然行人流动场景和不同类型地点（如交通、建筑和学校）的控制行人流动实验场景。数据集包含50,528帧，超过2,366,249个头部和2,358个跟踪轨迹。数据集涵盖了10个不同的场景，包括室内和室外环境（如街道、教室、屋顶、学校道路、路标、灯、玻璃和停车场）。每帧的人数范围从11到114人。大多数序列在Cchead中的帧率为50 fps。通过采样，高帧率（例如50fps）可以降低到低帧率（例如25fps），以满足实际需求。数据集是从两个视角（斜视图和俯视图）捕获的，以促进更广泛的应用场景。

特点

Cchead数据集的特点包括：1）包含10个场景，共50,528帧，超过2,366,249个头部和2,358个跟踪轨迹；2）场景多样，包括室内和室外环境，如街道、教室、屋顶、学校道路等；3）包含行人移动速度、方向和复杂的拥挤行人流动，以及碰撞避免行为；4）每帧的人数范围从11到114人，提供了多样化的数据；5）提供了高帧率视频和注释，以满足灵活和多样化的应用需求。

使用方法

Cchead数据集的使用方法包括：1）数据集可以用于训练和评估行人头部检测和跟踪算法；2）研究人员可以使用该数据集来开发新的算法，以解决高密度人群中的行人头部检测和跟踪问题；3）数据集可以用于评估现有算法在复杂场景中的性能；4）数据集可以用于研究行人头部检测和跟踪的理论和方法；5）数据集可以用于开发实际应用，如自动驾驶、机器人导航和行人流量监控。

背景与挑战

背景概述

行人检测与跟踪在视觉场景理解中具有广泛应用，包括自动驾驶、视频监控、行人流量动态监测和机器人导航等。随着行人密度的增加，检测与跟踪的复杂性也随之增加。尽管深度学习模型在行人头部检测方面取得了显著进展，但头部跟踪数据集和方法却极为缺乏。现有的头部数据集对复杂行人流和场景（如行人交互、遮挡和物体干扰）的覆盖有限。因此，开发新的头部跟踪数据集和方法具有重要意义。为了应对这些挑战，本文介绍了一个名为Cchead的中国大规模跨场景行人头部跟踪数据集和一个多源信息融合网络（MIFN）。该数据集包含10个场景，共50,528帧，超过2,366,249个头部和2,358条轨迹。Cchead数据集包含了行人移动速度、方向和复杂人群行人流，以及避碰行为。此外，本文还提出了一个端到端的CNN-based头部检测和跟踪网络MIFN，该网络联合训练RGB帧、像素级运动信息（光流和帧差图）、深度图和密度图。实验结果表明，MIFN在Cchead数据集上取得了优异的性能，为密集人群中的行人跟踪提供了有价值的资源和基线。

当前挑战

行人检测和跟踪在密集视频序列中面临着诸多挑战，包括类内遮挡、复杂运动和多样化姿势。尽管深度学习模型在头部检测方面取得了显著进展，但头部跟踪数据集和方法却极为缺乏。现有的头部数据集对复杂行人流和场景（如行人交互、遮挡和物体干扰）的覆盖有限。此外，背景物体与头部在特征上具有相似性（颜色、大小、纹理），使得在拥挤场景中检测和跟踪小尺度、多样化姿势和低光照头部变得困难。由于头部尺寸较小，在拥挤场景中难以以高置信度分数检测和跟踪头部。此外，移动头部会导致尺度和纹理的显著变化。输入信息源对实现准确的头部检测和跟踪至关重要。运动信息（如光流和帧差）可以增强头部特征并抑制背景特征。深度图可以提供有效的距离信息，而密度图可以突出头部的空间特征。现有的研究主要集中在静态图像、深度图或光流中的头部检测，并未考虑如何整合多种信息源来解决上述挑战。

常用场景

经典使用场景

Cchead数据集最经典的使用场景是在密集人群中进行行人头部检测和跟踪。该数据集包含10个不同的场景，包括自然行人和受控行人流量实验场景，如交通、建筑和学校等地。Cchead数据集包含超过236万个头部边界框和2358个跟踪，涵盖了行人移动速度、方向和复杂的行人流量，以及碰撞避免行为。这使得Cchead成为在密集和拥挤场景中进行行人头部检测和跟踪研究的重要资源。

实际应用

Cchead数据集的实际应用场景包括自动驾驶、机器人导航和行人流量监控。在自动驾驶中，Cchead数据集可以帮助车辆检测和跟踪行人的头部，以提高车辆的安全性和可靠性。在机器人导航中，Cchead数据集可以帮助机器人识别和跟踪行人的头部，以避免与行人发生碰撞。在行人流量监控中，Cchead数据集可以帮助监控系统检测和跟踪行人的头部，以分析行人的流量和行为模式。

衍生相关工作

Cchead数据集衍生了多源信息融合网络（MIFN），该网络是第一个端到端的CNN-based头部检测和跟踪网络，它联合训练RGB帧、像素级运动信息（光流和帧差图）、深度图和密度图。MIFN使用多源特征来有效地指导头部检测器和跟踪器提出稳健的头部框。MIFN在Cchead数据集上取得了优异的性能，为密集人群中的行人头部检测和跟踪研究提供了新的思路和方法。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集