动态停车数据集

Name: 动态停车数据集
Creator: 中国科学院自动化研究所
Published: 2025-06-20 17:14:09
License: 暂无描述

arXiv2025-06-20 更新2025-06-24 收录

下载链接：

https://github.com/little-snail-f/ParkFormer

下载链接

链接失效反馈

官方服务：

资源简介：

本文提出了一种基于Transformer的端到端自动驾驶停车模型，旨在解决动态环境下的停车问题。模型通过多任务感知网络，联合感知停车位拓扑、车辆状态和行人意图。引入了目标点编码器，将不同类型的停车位几何形状映射到共享的低维潜在空间，支持垂直和平行停车场景的统一政策建模。为了评估该方法的有效性，在CARLA模拟平台上构建了一个动态停车数据集，并进行了广泛的实验来验证系统的性能。

This paper proposes a Transformer-based end-to-end autonomous driving parking model aimed at addressing the parking problem in dynamic environments. The model adopts a multi-task perception network to jointly perceive parking space topology, vehicle states and pedestrian intentions. A target point encoder is introduced to map the geometric shapes of various parking space types into a shared low-dimensional latent space, enabling unified policy modeling for both perpendicular and parallel parking scenarios. To evaluate the effectiveness of the proposed method, a dynamic parking dataset is constructed on the CARLA simulation platform, and extensive experiments are conducted to verify the system's performance.

提供机构：

中国科学院自动化研究所

创建时间：

2025-06-20

原始信息汇总

ParkFormer数据集概述

数据集基本信息

名称: ParkFormer
类型: 自动驾驶停车多模态数据集
环境: CARLA 0.9.14仿真器
数据量: 46,400帧（272个结构化停车场景）

数据内容

传感器数据:
- 多视角RGB图像
- 深度图
- 鸟瞰图(BEV)
动态数据:
- 行人运动轨迹
- 自车运动状态
标注数据:
- 专家控制信号（转向/加速/刹车/档位）
- 目标停车位信息

场景特征

停车类型:
- 垂直停车（Town04-Opt场景）
- 平行停车（Town10HD-Opt场景）
环境复杂度:
- 包含动态行人干扰
- 多样化布局配置

评估指标

指标名称	数值
成功率	96.57%
位置误差	0.21m
方向误差	0.41°
碰撞率	1.16%

技术特点

多模态融合: 结合视觉BEV特征与目标位置注意力机制
动态预测: 集成行人轨迹GRU预测模块
控制输出: 离散化控制指令生成

文件结构

搜集汇总

数据集介绍

构建方式

动态停车数据集的构建依托于CARLA仿真平台，通过精心设计的垂直与平行停车场景模拟真实城市环境中的复杂停车条件。研究团队采用多视角鱼眼摄像头捕捉RGB图像，同步记录车辆运动状态、行人轨迹及深度信息，构建了包含46,400帧的多模态数据集。数据采集过程严格遵循质量约束，仅保留最终位置误差小于0.5米、偏航角误差低于0.5度的成功轨迹，确保了数据的精确性与可靠性。场景中随机生成的动态行人及多样化停车位布局，显著提升了数据的环境复杂度和泛化能力。

使用方法

研究者可通过加载预处理的多模态序列数据，训练端到端的Transformer停车策略模型。输入数据流包括四路环视图像、目标车位坐标、自车运动状态及行人动态信息，输出为离散化的油门、制动、转向和档位控制序列。建议采用课程学习策略，先固定行人数量训练基础停车能力，再逐步引入动态障碍物提升系统鲁棒性。评估阶段应重点关注成功率、位置误差、航向误差和碰撞率四项指标，通过消融实验验证行人预测模块与目标点注意力融合机制的性能增益。数据集配套提供CARLA仿真环境配置文件，支持闭环测试与可视化分析。

背景与挑战

背景概述

动态停车数据集由中国科学院自动化研究所的Jun Fu、Bin Tian等研究人员于2025年提出，旨在解决自动驾驶系统中复杂环境下的高精度泊车控制问题。该数据集基于CARLA 0.9.14仿真平台构建，涵盖了垂直和平行泊车场景，并引入了动态行人轨迹模拟真实城市环境。其核心创新在于融合了鸟瞰图特征与目标点编码的跨注意力机制，以及基于GRU的行人轨迹预测模块，显著提升了端到端泊车系统在异构场景中的泛化能力和安全性。作为首个公开的仿真动态泊车基准，该数据集为自动驾驶领域提供了更贴近实际的研究平台。

当前挑战

动态停车数据集主要应对两大挑战：在领域问题层面，传统基于规则的泊车系统难以处理狭窄空间内的动态障碍物交互和异构泊车位类型（如垂直/平行泊车）的统一策略建模；在构建过程中，需解决多模态传感器数据（环视摄像头、车辆运动状态、行人轨迹）的时空对齐问题，以及仿真环境与真实场景的域差距。具体技术难点包括：目标点嵌入导致的特征空间离散化、行人运动预测的时序误差累积，以及端到端框架中控制指令的离散化建模。

常用场景

经典使用场景

动态停车数据集在自动驾驶领域的研究中扮演着关键角色，特别是在复杂城市环境下的高精度停车控制任务中。该数据集通过模拟真实场景中的多模态输入，包括环视摄像头图像、目标停车位信息、自车运动状态以及行人轨迹，为端到端停车策略的学习提供了丰富的数据支持。其经典使用场景主要体现在垂直和平行停车两种典型布局的仿真环境中，研究者可利用该数据集验证模型在动态障碍物干扰下的适应能力与泛化性能。

解决学术问题

该数据集有效解决了传统基于规则的停车系统在环境不确定性和动态场景适应性方面的局限性。通过提供精确标注的多模态时序数据，支持了目标点注意力融合、行人轨迹预测等关键技术的研发，显著提升了停车控制的位置精度（0.21米）和方向准确性（0.41度）。其创新性的跨模态特征融合机制为异构停车位几何的统一建模提供了解决方案，推动了端到端自动驾驶在微观场景中的研究进展。

实际应用

在实际应用层面，该数据集支撑的ParkFormer框架已展现出在智能停车场的落地潜力。通过环视摄像头和运动传感器的实时数据输入，系统能准确识别停车位拓扑结构并预测行人意图，实现厘米级精度的自动泊车。在模拟测试中达到96.57%的成功率，特别适合解决狭窄车道、密集障碍物等复杂场景下的停车难题，为未来智能交通系统中的自主泊车功能提供了可靠的技术验证平台。

数据集最近研究