TSTTC

Name: TSTTC
Creator: 天津大学
Published: 2023-11-06 14:19:42
License: 暂无描述

arXiv2023-11-06 更新2024-06-21 收录

下载链接：

https://open-dataset.tusen.ai/TSTTC

下载链接

链接失效反馈

官方服务：

资源简介：

TSTTC数据集是由天津大学和TuSimple共同创建的大型时间到接触（TTC）估计数据集，专注于驾驶场景。该数据集包含超过200,000个序列，覆盖400米的深度范围，每个序列包含六个连续帧，每秒10帧，提供2D和3D边界框以及TTC地面实况。数据集通过数千小时的驾驶数据筛选和平衡不同TTC值的样本，同时使用神经渲染方法生成小TTC案例的片段以增加数据量。TSTTC数据集旨在推动基于单目相机的TTC估计技术，适用于高级驾驶辅助系统和自动驾驶系统，特别是在高速公路上需要更广泛感知能力的场景。

The TSTTC dataset is a large-scale time-to-contact (TTC) estimation dataset jointly created by Tianjin University and TuSimple, focusing on driving scenarios. This dataset contains over 200,000 sequences spanning a depth range of 400 meters. Each sequence consists of six consecutive frames captured at 10 frames per second, and provides 2D and 3D bounding boxes along with TTC ground truth. The dataset is developed by screening thousands of hours of driving data and balancing samples with different TTC values, while also using neural rendering methods to generate segments of cases with small TTC values to expand the dataset size. The TSTTC dataset aims to advance monocular camera-based TTC estimation technologies, and is applicable to Advanced Driver Assistance Systems (ADAS) and autonomous driving systems, particularly in scenarios requiring broader perception capabilities on highways.

提供机构：

天津大学

创建时间：

2023-09-04

搜集汇总

数据集介绍

构建方式

在自动驾驶领域，碰撞时间估计是评估安全风险的核心任务，TSTTC数据集的构建旨在填补真实驾驶场景中大规模标注数据的空白。该数据集通过商用重型卡车平台采集原始数据，整合了前向与后向多视角摄像头、激光雷达及雷达传感器，以10Hz频率捕获连续帧序列。为确保数据质量与分布均衡，研究团队预设了TTC值的数据分布，从数千小时驾驶记录中筛选出超过20万条有效序列，并针对小TTC值稀缺场景，创新性地采用神经辐射场技术生成合成数据，从而增强数据集的多样性与覆盖范围。

使用方法

该数据集主要用于支持基于单目视觉的碰撞时间估计算法研发，其任务定义为：给定包含六帧连续图像及对应二维边界框的序列，以最后一帧为目标帧，要求预测该帧中指定目标的TTC值。研究者可利用数据集提供的多模态标注，开发从传统图像相似度度量到深度学习特征匹配的各类算法。数据集中已包含基于像素均方误差的浅层方法与基于深度特征尺度分类的基线模型，为后续研究提供了可比较的基准。数据集按采集日期划分为训练、验证与测试集，确保了时间连续性上的泛化评估，并附有完整工具链以促进算法迭代与性能验证。

背景与挑战

背景概述

在自动驾驶与高级驾驶辅助系统（ADAS）领域，时间到碰撞（Time-to-Contact, TTC）估计是评估碰撞风险、实现前向碰撞预警（FCW）和自动紧急制动（AEB）等安全功能的核心技术。传统TTC估计方法多依赖手工特征或理论模型，但其在复杂真实场景中的泛化能力有限。随着深度学习技术的发展，数据驱动的TTC算法逐渐兴起，然而大规模、高质量的真实驾驶场景TTC数据集的缺失严重制约了相关研究的进展。为此，天津大学与图森未来（TuSimple）的研究团队于2023年联合推出了TSTTC数据集，旨在通过覆盖城市与高速公路场景的大规模单目视觉序列，为TTC估计研究提供丰富的真实世界数据支持。该数据集包含超过20万条序列，涵盖深度范围达400米，并创新性地引入神经辐射场（NeRF）渲染技术以增强小TTC值场景的样本多样性，显著推动了视觉基TTC估计方法的标准化与性能提升。

当前挑战

TSTTC数据集致力于解决驾驶场景中基于单目视觉的时间到碰撞（TTC）估计问题，其核心挑战在于如何准确、鲁棒地从图像序列中推断物体与观察者之间的碰撞时间。这一任务面临多重困难：首先，TTC估计需在物体尺度变化微小、运动状态复杂（如加减速、变道）的条件下保持高精度，这对算法的敏感度与稳定性提出了极高要求；其次，真实驾驶数据中TTC值分布极不均衡，小TTC（即高风险碰撞）场景样本稀缺，导致模型难以学习关键风险模式。在数据集构建过程中，研究团队亦遭遇显著挑战：一方面，需从数千小时的原始驾驶数据中筛选并标注高质量序列，同时通过预设分布对TTC值进行再平衡，以覆盖从负值（远离）到关键值（0-3秒）的完整范围；另一方面，为弥补高风险场景数据的不足，团队采用NeRF技术生成合成序列，但需确保合成数据与真实场景间的域差异最小化，以维持模型在真实环境中的有效性。

常用场景

经典使用场景

在自动驾驶与高级驾驶辅助系统领域，碰撞时间估计是评估潜在风险的核心任务。TSTTC数据集以其大规模真实驾驶场景序列，为基于单目视觉的TTC估计算法提供了关键训练与验证平台。该数据集通过精心筛选的超过20万条序列，覆盖城市与高速公路场景，并利用神经辐射场技术增强小TTC样本的多样性，从而支撑模型在关键危险场景下的鲁棒性学习。

解决学术问题

TSTTC数据集有效解决了单目视觉TTC估计中数据稀缺与分布不平衡的学术难题。传统方法依赖手工特征或合成数据，存在域适应差距与泛化能力不足的问题。该数据集通过真实传感器融合标注与预设数据分布，提供了精确的TTC真值，使得深度学习模型能够直接从图像中学习尺度变化与时间关系的映射，推动了从几何驱动到数据驱动的范式转变，并为碰撞预警算法的可靠性研究奠定了数据基础。

实际应用

在实际应用中，TSTTC数据集直接服务于前向碰撞预警与自动紧急制动等高级驾驶辅助系统的开发。通过提供涵盖不同相对速度与距离的驾驶序列，该数据集使算法能够在复杂光照、天气及交通流条件下准确估计碰撞时间，从而提升系统在高速公路等高速场景下的感知冗余与安全性能。其标注的2D与3D边界框信息进一步促进了多传感器融合技术在量产系统中的落地。

数据集最近研究