Personalized Driving Dataset (PDD)

github2026-04-09 更新2026-04-10 收录

下载链接：

https://github.com/tasl-lab/DMW

下载链接

链接失效反馈

官方服务：

资源简介：

PDD收集了在CARLA中使用方向盘设置的真实人类驾驶演示，涵盖了多种交互场景：切入、行人、避障、合并等。

PDD collected real human driving demonstrations using steering wheel setups in CARLA, covering various interactive scenarios including lane cutting, pedestrian interactions, obstacle avoidance, merging, and more.

创建时间：

2026-03-19

原始信息汇总

Drive My Way (DMW) 数据集概述

数据集基本信息

数据集名称：Drive My Way (DMW) / Personalized Driving Dataset (PDD)
核心内容：一个用于个性化驾驶的视觉-语言-动作（VLA）模型框架及其配套的真实人类驾驶演示数据集。
相关论文：Drive My Way: Preference Alignment of Vision-Language-Action Model for Personalized Driving
论文状态：已被CVPR 2026接收。
论文链接：https://arxiv.org/abs/2603.25740
项目网站：https://dmw-cvpr.github.io/
研究团队：University of California, Riverside, University of Michigan (TASL Lab)
许可协议：MIT

数据集核心特性与目标

研究目标：解决现有端到端自动驾驶系统无法适应个体驾驶偏好或理解自然语言意图的问题。
核心方法：提出一个个性化VLA驾驶框架，能够与用户的长期驾驶习惯对齐，并适应实时用户指令。
关键特性：
1. 长期偏好学习：通过对比偏好编码器从结构化的驾驶员档案和历史驾驶行为中学习用户嵌入，捕捉稳定的个人驾驶习惯。
2. 短期指令对齐：通过运行时的自然语言指令引导策略适应用户的即时意图。
3. 基于GRPO的策略对齐：使用具有风格感知奖励的组相对策略优化，使VLA策略与多样化的用户偏好对齐，无需依赖显式的人类反馈。
评估结果：在Bench2Drive基准上的闭环评估表明，DMW改善了风格指令适应能力；用户研究表明，其生成的行为可被识别为每个驾驶员自身的风格。

个性化驾驶数据集详情

数据集名称：Personalized Driving Dataset (PDD)
数据内容：在CARLA模拟器中，使用方向盘设备采集的、覆盖多个真实驾驶员和多种条件的真实人类驾驶演示数据。
场景覆盖：涵盖广泛的交互式场景，包括切入、行人、避障、并道等。
数据下载地址：https://huggingface.co/datasets/tasl-lab/PDD/tree/main

环境与依赖

操作系统：Linux (推荐 Ubuntu 20.04+)
包管理：Conda / Miniconda
CUDA版本：12.1 (用于 PyTorch 2.2.0 + flash-attn)
模拟器：CARLA 0.9.15
基础模型：InternVL2-1B (作为基础视觉语言模型)
关键Python库：accelerate >= 1.4.0, datasets >= 3.0.0, transformers >= 4.55.0, 自定义TRL库 (用于GRPO训练)

项目结构

项目主要目录包括用于GRPO后训练的grpo/、模型架构model/、CARLA代理team_code/、评估模块leaderboard/、场景运行器scenario_runner/、预训练模型pretrained/以及数据配置data/。checkpoints/目录待发布。

引用

如需引用本工作，请使用提供的BibTeX条目。

搜集汇总

数据集介绍

构建方式

个性化驾驶数据集（PDD）的构建依托于高保真驾驶模拟环境CARLA，通过真实驾驶员在多样化交互场景中的操作记录，系统性地采集驾驶行为数据。数据采集过程采用方向盘操控装置，模拟真实驾驶情境，涵盖切入、行人交互、障碍物规避及并线等多种复杂场景。多驾驶员参与确保了数据集的个体差异性，为捕捉长期驾驶习惯与短期意图提供了丰富的行为样本。

特点

该数据集的核心特征在于其深度个性化与场景多样性，不仅记录了驾驶动作序列，还融合了驾驶员的长时期偏好与实时自然语言指令。数据集覆盖了广泛的交互情境，能够反映不同驾驶员在加速、制动、转向等操作中的独特风格。通过结构化驾驶员档案与历史行为数据，数据集支持对比学习框架，有效编码用户嵌入向量，从而为个性化驾驶策略的建模提供了坚实的数据基础。

使用方法

使用个性化驾驶数据集时，研究人员需首先配置CARLA仿真环境与相关依赖，通过Hugging Face平台获取数据资源。数据集适用于训练视觉-语言-动作模型，结合GRPO优化方法对齐用户偏好。在实际应用中，可将数据集输入至预训练的基座模型，利用驾驶员嵌入向量与自然语言指令共同条件化策略网络，实现个性化驾驶行为的生成与评估。

背景与挑战

背景概述

在自动驾驶技术追求通用安全性的进程中，个性化驾驶行为的研究逐渐成为实现人本主义智能交通的关键。由加州大学河滨分校TASL实验室主导，于2026年提出的个性化驾驶数据集（Personalized Driving Dataset, PDD），旨在捕捉真实驾驶者因长期习惯与短期意图所形成的独特驾驶风格。该数据集通过多驾驶员在CARLA仿真环境中的实际操控记录，构建了涵盖切入、行人交互、障碍物规避等多种场景的驾驶行为库，为核心研究问题——如何使端到端自动驾驶系统理解并适应个体偏好——提供了实证基础。PDD的建立推动了视觉-语言-动作模型在个性化驾驶领域的对齐研究，为构建更具适应性和人性化的自动驾驶系统奠定了数据基石。

当前挑战

个性化驾驶数据集所应对的核心领域挑战在于，如何从高维、连续的驾驶行为序列中有效建模并区分不同驾驶者的稳定偏好，同时将自然语言指令实时融入决策过程，以解决现有系统在个性化适应与意图解释方面的不足。在数据集构建过程中，挑战具体体现在多驾驶员数据采集的协调与一致性保障，需在仿真环境中设计涵盖丰富交互场景的测试用例，并确保通过方向盘设备记录的行为数据能真实反映个体差异。此外，将异构的视觉观测、语言指令与操控动作进行高质量对齐与标注，亦对数据集的可靠性与泛化能力提出了严格要求。

常用场景

经典使用场景

在自动驾驶研究领域，个性化驾驶数据集（PDD）为探索驾驶行为的个体差异提供了关键数据支撑。该数据集通过采集多位真实驾驶员在CARLA仿真环境中多样化的交互场景数据，如切入、行人避让和障碍物规避等，经典地应用于训练和评估个性化驾驶模型。研究人员利用PDD中的驾驶轨迹和用户嵌入表示，能够深入分析不同驾驶习惯对决策过程的影响，从而推动端到端自动驾驶系统向个性化方向演进。

实际应用

在实际应用层面，个性化驾驶数据集（PDD）为开发适应性更强的自动驾驶系统提供了重要参考。基于PDD训练的个性化驾驶模型可集成于智能车辆中，根据车主的驾驶习惯调整加速、制动和变道等行为，提升乘坐舒适性与信任度。同时，该数据集支持自然语言指令的实时响应，使驾驶员能够通过语音指令临时调整驾驶风格，增强了人车交互的灵活性与安全性，为未来个性化自动驾驶技术的商业化落地铺平道路。

衍生相关工作

围绕个性化驾驶数据集（PDD），一系列经典研究工作得以衍生。例如，Drive My Way（DMW）框架利用PDD学习用户嵌入，并结合GRPO优化策略，实现了视觉-语言-动作模型的个性化对齐。此外，PDD也为Bench2Drive等基准测试提供了评估数据，推动了驾驶风格适应性与指令跟随能力的研究。这些工作共同拓展了个性化驾驶的学术边界，为多模态交互与强化学习在自动驾驶领域的融合提供了范例。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集