TrafﬁcCAM

Name: TrafﬁcCAM
Creator: 剑桥大学
Published: 2022-11-18 00:14:38
License: 暂无描述

arXiv2022-11-18 更新2024-06-21 收录

下载链接：

https://anonymous_submission

下载链接

链接失效反馈

官方服务：

资源简介：

TrafﬁcCAM是由剑桥大学等机构创建的大规模交通流量图像数据集，包含4,402个带有语义和实例标注的图像帧以及59,944个未标注的图像帧。该数据集通过在印度八个城市的街道上安装的固定摄像头记录的视频序列构成，涵盖了多种车辆和行人。TrafﬁcCAM旨在为全监督和半监督学习技术建立新基准，特别强调大量未标注数据的使用，以低成本的标注要求更好地捕捉交通流量质量。该数据集适用于交通流量分析，旨在优化交通管理，减少拥堵，并推动智能交通解决方案的发展。

TrafficCAM is a large-scale traffic flow image dataset developed by institutions including the University of Cambridge. It contains 4,402 image frames with semantic and instance annotations, as well as 59,944 unlabeled image frames. This dataset is constructed from video sequences recorded by fixed cameras installed on streets across eight cities in India, covering a variety of vehicle types and pedestrians. TrafficCAM aims to establish new benchmarks for fully supervised and semi-supervised learning technologies, with particular emphasis on utilizing large volumes of unlabeled data to better characterize traffic flow quality at a low annotation cost. This dataset is applicable to traffic flow analysis, with the goals of optimizing traffic management, reducing congestion, and promoting the development of intelligent transportation solutions.

提供机构：

剑桥大学

创建时间：

2022-11-18

搜集汇总

数据集介绍

构建方式

TrafficCAM数据集从印度八座城市的交通监控摄像头中采集视频素材，覆盖地理上的南北、东西及内陆区域，确保场景多样性。视频分辨率范围从352×288到1920×1080，反映了不同摄像设备带来的异质性。数据集包含2,148段视频，从中提取64,346帧图像，其中78段视频提供完整的像素级与实例级标注（每段视频约30帧），其余2,068段视频仅标注首帧，由此产生59,944帧无标注图像。数据集以视频为单位划分为训练集、验证集和测试集，确保同一视频的帧不跨集出现；训练集包含所有仅首帧标注的视频及8段全标注视频，验证集与测试集从剩余全标注视频中随机分割。

特点

TrafficCAM的数据集特点体现在两大方面。其一，它提供了10个细粒度类别，涵盖摩托车、巴士、轻型机动车、自动人力车、自行车、轻型商用车、电动三轮车、拖拉机、卡车及行人，是首个在交通流分割中纳入如此丰富车辆类型的数据集，突破了现有数据集仅关注单一或少量类别的局限。其二，TrafficCAM首次引入大量无标注数据（59,944帧），与标注帧的比例高达30:1，为半监督学习研究提供了独特基准。此外，数据集呈现典型的长尾分布，摩托车与轻型机动车占据约90%的实例，而自行车与拖拉机等类别样本稀缺，增加了模型的挑战性。

使用方法

TrafficCAM支持全监督与半监督下的语义分割和实例分割任务。对于全监督语义分割，可采用ResNet或Transformer骨干网络（如DeepLabV3+、SegFormer），通过随机翻转、多尺度缩放及裁剪等数据增强策略训练模型，评估指标为平均交并比（mIoU）。全监督实例分割则基于Mask R-CNN、Mask2Former等框架，使用区域级平均精度（mAP）进行评测。在半监督场景中，研究者可灵活选择标注比例（如1/27至1/216），利用大量无标注帧配合CutMix、ClassMix或三阶段自训练等方法提升模型泛化能力。数据集已在MMSegmentation和MMDetection工具包中集成，便于复现与扩展。

背景与挑战

背景概述

交通流量分析作为智能交通管理的核心环节，对于缓解城市拥堵、优化物流调度及减少交通事故具有关键意义。然而，现有交通流数据集普遍存在类别单一、标注数据稀缺等局限，难以支撑复杂场景下的精细化分析。针对这一困境，由英国萨里大学、剑桥大学及布里斯托尔大学的研究人员于2022年共同创建的TrafficCAM数据集应运而生。该数据集聚焦于固定摄像头视角下的交通流分割任务，采集自印度八座城市的街道监控视频，涵盖从352×288至1920×1080的多种分辨率。TrafficCAM不仅提供了包含10个细粒度类别（如摩托车、公交车、轻型机动车、自动人力车、自行车、轻型商用车、电动三轮车、拖拉机、卡车及行人）的像素级与实例级标注，还首次引入了59,944帧大规模未标注图像，为半监督学习范式的探索奠定了坚实基础。其发布标志着交通流分割领域向大规模、多类别、低成本标注方向迈出了重要一步。

当前挑战

TrafficCAM数据集在推动交通流分析发展的同时，也面临多重挑战。首先，在领域问题层面，现有模型在该数据集上的表现远未达到理想水平——全监督语义分割的最佳平均交并比仅为66.49%，实例分割的平均精度亦不足50%，这揭示了类别间极度不均衡（如摩托车与轻型机动车占据90%以上样本，而自行车与拖拉机样本不足600帧）以及复杂场景（如夜间、雾天条件）带来的严峻挑战。其次，在构建过程中，数据采集面临跨城市地理分布、多类型摄像头分辨率差异以及交通流密集区域中微小目标（如远处行人）的精确标注难题；同时，为支撑半监督学习而设计的未标注帧与标注帧高达30:1的比例，对伪标签质量的控制和模型泛化能力提出了更高要求，现有半监督方法在极端标签稀缺场景下性能显著衰减，表明该领域仍需更鲁棒的学习策略。

常用场景

经典使用场景

TrafficCAM数据集专为交通流分割任务设计，其核心应用场景聚焦于从固定监控摄像头捕获的复杂城市交通画面中，精准分离并识别多种车辆与行人。该数据集提供像素级与实例级语义标注，涵盖摩托车、巴士、轻型机动车、自动人力车、自行车、轻型商用车、电动三轮车、拖拉机、卡车及行人共十类移动交通参与者。其独特的固定摄像头视角与多样化印度城市街景，使其成为训练和评估交通流分割模型的理想基准，尤其适用于需要细粒度交通对象理解的场景。

解决学术问题

该数据集有效解决了现有交通流数据集中类别单一、标注数据稀缺两大核心学术难题。通过提供十类细粒度交通对象，TrafficCAM打破了以往数据集仅关注单一车辆类型的局限，为多类别交通流分析奠定了数据基础。同时，其首次引入大规模未标注帧（标注与未标注比例达1:30），推动了半监督学习技术在交通分割领域的发展，显著降低了像素级标注的高昂成本。这一特性为开发鲁棒性强、泛化能力高的模型开辟了新路径，使在有限标注下捕捉复杂交通模式成为可能。

衍生相关工作

TrafficCAM数据集的发布催生了多项经典研究工作，尤其在半监督与全监督分割方法的验证与改进上。例如，研究人员基于该数据集评估了FCN、PSPNet、DeepLabV3+等经典语义分割模型，以及Mask R-CNN、Mask2Former等实例分割方法，揭示了长尾分布与场景多样性带来的挑战。在半监督领域，Three-stage Self-training与ClassMix等框架借助其大量未标注数据，展示了伪标签与数据增强策略的性能增益。这些工作不仅验证了数据集的基准价值，还推动了更鲁棒、更高效分割算法的迭代发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集