Waymo Motion dataset
收藏arXiv2025-05-30 更新2025-05-31 收录
下载链接:
https://arma-traj.github.io/
下载链接
链接失效反馈官方服务:
资源简介:
该数据集基于Waymo Motion数据集,增加了详尽的帧级元动作标注,用于支持自动驾驶系统中的可控轨迹生成。数据集采用自回归元动作框架,将传统的长时间间隔元动作分解为帧级元动作,确保了轨迹段与其对应元动作之间的严格对齐,从而在整个轨迹跨度内实现了一致和统一的任务表述。数据集旨在解决现有框架中元动作与实际行为轨迹之间的时间错位问题,通过实验验证了该框架在轨迹适应性和动态决策场景中的响应性。
This dataset is developed based on the Waymo Motion dataset, with exhaustive frame-level meta-action annotations added to support controllable trajectory generation in autonomous driving systems. It adopts an autoregressive meta-action framework, which decomposes traditional long-interval meta-actions into frame-level meta-actions, ensuring strict alignment between trajectory segments and their corresponding meta-actions, thus achieving consistent and unified task representation across the entire trajectory span. This dataset aims to resolve the temporal misalignment between meta-actions and actual behavioral trajectories in existing frameworks, and experimental results have verified the framework’s trajectory adaptability and responsiveness in dynamic decision-making scenarios.
提供机构:
中国科学技术大学
创建时间:
2025-05-30
搜集汇总
数据集介绍

构建方式
Waymo Motion数据集通过高精度的传感器采集真实道路场景中的车辆轨迹数据,构建了一个覆盖多样化驾驶场景的大规模自动驾驶数据集。研究团队采用多阶段标注流程,首先通过车载LiDAR和摄像头采集原始轨迹数据,随后利用半自动化的轨迹分割算法提取关键行为片段,最后由专业标注团队进行帧级元动作标注,确保每个轨迹点都与特定的高级驾驶决策(如车道保持、变道、转弯等)精确对应。数据集构建过程中特别注重时序对齐,采用滑动窗口策略验证轨迹与元动作的同步性,并通过交叉验证消除标注歧义。
特点
该数据集的核心特点在于其精细的帧级元动作标注体系,将传统长间隔的驾驶决策分解为逐帧的原子动作,实现了轨迹生成与高级语义的严格对齐。数据集包含超过1000小时的多样化驾驶场景,涵盖城市道路、高速公路和复杂交叉路口等环境,每个场景均提供车辆状态、环境上下文和元动作标签的三元组数据。特别值得注意的是,数据集采用基于运动学和拓扑规则的双重验证机制,确保标注的元动作既符合车辆动力学特性,又与真实道路拓扑逻辑一致,为可控轨迹生成提供了可靠的监督信号。
使用方法
使用该数据集时,建议采用论文提出的分阶段训练框架:首先在纯轨迹数据上预训练基础运动模型以学习通用运动模式,随后冻结基础网络参数,引入元动作预测和注入模块进行针对性微调。数据集支持两种典型应用范式:对于决策跟随任务,可将特定元动作序列作为条件输入,通过自回归生成符合语义约束的轨迹;对于决策解释任务,可利用帧级元动作概率分布反推轨迹的语义意图。数据加载时应特别注意轨迹-元动作的时序对齐,建议采用论文提供的滑动窗口验证工具确保数据一致性。
背景与挑战
背景概述
Waymo Motion Dataset是由Waymo公司于2020年推出的自动驾驶领域重要数据集,旨在推动运动预测和轨迹生成算法的研究。该数据集由美国科学技术大学中国分校与Mach Drive研究团队联合开发,收录了丰富多样的城市驾驶场景,包含高精度传感器采集的车辆、行人等多智能体运动轨迹及高清地图数据。作为首个提供大规模连续运动序列标注的数据集,其核心研究问题聚焦于如何从历史轨迹和环境上下文中预测未来运动模式,为自动驾驶决策规划系统提供关键技术支持。该数据集通过标准化评估协议显著提升了轨迹预测领域的可比性,已成为测试多智能体交互建模算法性能的基准平台。
当前挑战
该数据集面临的主要挑战体现在两个维度:在领域问题层面,传统长间隔元动作标注存在时序错位问题,导致轨迹段与高级语义决策的关联性降低,影响模型对驾驶意图的准确解读;在构建过程层面,帧级元动作标注的生成需要精确融合运动学特征与道路拓扑结构,而复杂场景下的行为歧义(如变道与转弯的过渡阶段)对标注一致性提出了严峻考验。此外,多智能体交互的动态性和地图元素的异质性进一步增加了数据标注与质量控制的复杂度。
常用场景
经典使用场景
Waymo Motion dataset在自动驾驶轨迹预测领域具有广泛的应用价值,尤其在元动作引导的可控轨迹生成研究中扮演关键角色。该数据集通过提供丰富的车辆运动轨迹和高清地图信息,为研究者构建了一个真实的城市驾驶场景模拟环境。其最经典的使用场景在于训练和评估基于元动作的轨迹预测模型,例如将高级驾驶决策(如变道、转弯)与低层运动轨迹精确对齐的算法开发。
实际应用
在实际应用中,该数据集支撑了自动驾驶系统的关键功能开发,包括导航规划、危险行为预测和决策解释。汽车制造商利用其丰富的变道、转弯等场景数据,训练能够理解驾驶员意图的预测模型。科技公司则基于该数据集开发具有行为解释能力的仿真系统,可实时显示如'正在执行左变道'等语义决策,显著提升了人机协同驾驶的透明度。
衍生相关工作
该数据集催生了多项自动驾驶领域的创新研究,包括基于自回归元动作的轨迹预测框架(ARMA)、决策感知的仿真系统(DriveLM)以及多模态运动预测模型(MotionLM)。特别值得注意的是,其帧级标注方案启发了后续工作如KiGRAS对运动学控制空间的建模,以及Gen-Drive将扩散模型与强化学习结合的混合方法,推动了可控轨迹生成技术的范式演进。
以上内容由遇见数据集搜集并总结生成



