Cchead|行人跟踪数据集|自动驾驶数据集
收藏arXiv2024-08-12 更新2024-08-14 收录
下载链接:
http://arxiv.org/abs/2408.05877v1
下载链接
链接失效反馈资源简介:
Cchead数据集由清华大学、新加坡国立大学和武汉理工大学联合创建,专注于密集场景下的行人头部跟踪。该数据集包含50,528帧视频,标注了超过2,366,249个头部和2,358条轨迹,涵盖10种不同场景。数据集的创建过程包括手动标注和使用工具如Darklabel和CVAT进行辅助。Cchead数据集的应用领域主要集中在自动驾驶、机器人导航和行人流量监控等,旨在解决高密度人群中行人头部检测和跟踪的挑战。
提供机构:
清华大学自动化系,新加坡国立大学设计与工程学院建筑环境系,武汉理工大学智能交通系统研究中心
创建时间:
2024-08-12
AI搜集汇总
数据集介绍

构建方式
Cchead数据集的构建方式是在武汉理工大学、保定科技园区等地拍摄了10个场景的视频,包括自然行人流动场景和不同类型地点(如交通、建筑和学校)的控制行人流动实验场景。数据集包含50,528帧,超过2,366,249个头部和2,358个跟踪轨迹。数据集涵盖了10个不同的场景,包括室内和室外环境(如街道、教室、屋顶、学校道路、路标、灯、玻璃和停车场)。每帧的人数范围从11到114人。大多数序列在Cchead中的帧率为50 fps。通过采样,高帧率(例如50fps)可以降低到低帧率(例如25fps),以满足实际需求。数据集是从两个视角(斜视图和俯视图)捕获的,以促进更广泛的应用场景。
特点
Cchead数据集的特点包括:1)包含10个场景,共50,528帧,超过2,366,249个头部和2,358个跟踪轨迹;2)场景多样,包括室内和室外环境,如街道、教室、屋顶、学校道路等;3)包含行人移动速度、方向和复杂的拥挤行人流动,以及碰撞避免行为;4)每帧的人数范围从11到114人,提供了多样化的数据;5)提供了高帧率视频和注释,以满足灵活和多样化的应用需求。
使用方法
Cchead数据集的使用方法包括:1)数据集可以用于训练和评估行人头部检测和跟踪算法;2)研究人员可以使用该数据集来开发新的算法,以解决高密度人群中的行人头部检测和跟踪问题;3)数据集可以用于评估现有算法在复杂场景中的性能;4)数据集可以用于研究行人头部检测和跟踪的理论和方法;5)数据集可以用于开发实际应用,如自动驾驶、机器人导航和行人流量监控。
背景与挑战
背景概述
行人检测与跟踪在视觉场景理解中具有广泛应用,包括自动驾驶、视频监控、行人流量动态监测和机器人导航等。随着行人密度的增加,检测与跟踪的复杂性也随之增加。尽管深度学习模型在行人头部检测方面取得了显著进展,但头部跟踪数据集和方法却极为缺乏。现有的头部数据集对复杂行人流和场景(如行人交互、遮挡和物体干扰)的覆盖有限。因此,开发新的头部跟踪数据集和方法具有重要意义。为了应对这些挑战,本文介绍了一个名为Cchead的中国大规模跨场景行人头部跟踪数据集和一个多源信息融合网络(MIFN)。该数据集包含10个场景,共50,528帧,超过2,366,249个头部和2,358条轨迹。Cchead数据集包含了行人移动速度、方向和复杂人群行人流,以及避碰行为。此外,本文还提出了一个端到端的CNN-based头部检测和跟踪网络MIFN,该网络联合训练RGB帧、像素级运动信息(光流和帧差图)、深度图和密度图。实验结果表明,MIFN在Cchead数据集上取得了优异的性能,为密集人群中的行人跟踪提供了有价值的资源和基线。
当前挑战
行人检测和跟踪在密集视频序列中面临着诸多挑战,包括类内遮挡、复杂运动和多样化姿势。尽管深度学习模型在头部检测方面取得了显著进展,但头部跟踪数据集和方法却极为缺乏。现有的头部数据集对复杂行人流和场景(如行人交互、遮挡和物体干扰)的覆盖有限。此外,背景物体与头部在特征上具有相似性(颜色、大小、纹理),使得在拥挤场景中检测和跟踪小尺度、多样化姿势和低光照头部变得困难。由于头部尺寸较小,在拥挤场景中难以以高置信度分数检测和跟踪头部。此外,移动头部会导致尺度和纹理的显著变化。输入信息源对实现准确的头部检测和跟踪至关重要。运动信息(如光流和帧差)可以增强头部特征并抑制背景特征。深度图可以提供有效的距离信息,而密度图可以突出头部的空间特征。现有的研究主要集中在静态图像、深度图或光流中的头部检测,并未考虑如何整合多种信息源来解决上述挑战。
常用场景
经典使用场景
Cchead数据集最经典的使用场景是在密集人群中进行行人头部检测和跟踪。该数据集包含10个不同的场景,包括自然行人和受控行人流量实验场景,如交通、建筑和学校等地。Cchead数据集包含超过236万个头部边界框和2358个跟踪,涵盖了行人移动速度、方向和复杂的行人流量,以及碰撞避免行为。这使得Cchead成为在密集和拥挤场景中进行行人头部检测和跟踪研究的重要资源。
实际应用
Cchead数据集的实际应用场景包括自动驾驶、机器人导航和行人流量监控。在自动驾驶中,Cchead数据集可以帮助车辆检测和跟踪行人的头部,以提高车辆的安全性和可靠性。在机器人导航中,Cchead数据集可以帮助机器人识别和跟踪行人的头部,以避免与行人发生碰撞。在行人流量监控中,Cchead数据集可以帮助监控系统检测和跟踪行人的头部,以分析行人的流量和行为模式。
衍生相关工作
Cchead数据集衍生了多源信息融合网络(MIFN),该网络是第一个端到端的CNN-based头部检测和跟踪网络,它联合训练RGB帧、像素级运动信息(光流和帧差图)、深度图和密度图。MIFN使用多源特征来有效地指导头部检测器和跟踪器提出稳健的头部框。MIFN在Cchead数据集上取得了优异的性能,为密集人群中的行人头部检测和跟踪研究提供了新的思路和方法。
以上内容由AI搜集并总结生成
