StyleDrive

Name: StyleDrive
Creator: 清华大学智能系统与计算实验室(AIR, Tsinghua University)
Published: 2025-06-30 23:48:38
License: 暂无描述

arXiv2025-06-30 更新2025-07-02 收录

下载链接：

https://github.com/AIR-THU/StyleDrive

下载链接

链接失效反馈

官方服务：

资源简介：

StyleDrive数据集是一个大规模的真实世界数据集，专为个性化端到端自动驾驶(E2EAD)设计，包含近30,000个驾驶场景，并标注了风格偏好。数据集由清华大学智能系统与计算实验室(AIR)创建，旨在解决当前自动驾驶系统中缺乏大规模、真实世界数据集，且缺乏对个性化驾驶风格的细粒度标注的问题。数据集涵盖了广泛的城市和乡村驾驶环境，通过静态环境特征提取和动态上下文线索推断，为端到端自动驾驶系统的个性化提供基础。

The StyleDrive dataset is a large-scale real-world dataset specifically designed for personalized end-to-end autonomous driving (E2EAD), comprising nearly 30,000 driving scenarios annotated with style preferences. Developed by the Intelligent Systems and Computing Laboratory (AIR) at Tsinghua University, it aims to address the two critical gaps in current autonomous driving systems: the scarcity of large-scale real-world datasets and the lack of fine-grained annotations for personalized driving styles. The dataset covers diverse urban and rural driving environments, and provides a solid foundation for the personalization of end-to-end autonomous driving systems through static environmental feature extraction and dynamic contextual cue inference.

提供机构：

清华大学智能系统与计算实验室(AIR, Tsinghua University)

创建时间：

2025-06-30

原始信息汇总

StyleDrive 数据集概述

数据集简介

名称：StyleDrive
目标：建立首个大规模真实世界数据集，用于个性化端到端自动驾驶（E2EAD）的基准测试
特点：
- 包含丰富的多样化驾驶偏好标注
- 使用静态道路拓扑和微调的视觉语言模型（VLM）提取上下文特征
- 通过行为分析、基于VLM的建模和人类验证获取客观和主观偏好标签

数据集构造

方法：提出统一的框架用于建模和标注个性化驾驶偏好
流程：
1. 场景构建：基于静态道路拓扑和VLM提取细粒度场景特征
2. 偏好标注：结合行为分析和人类验证

数据集内容

基准测试结果：包含多种模型的性能比较（AD-MLP、TransFuser、WoTE、DiffusionDrive等）
评估指标：NC、DAC、TTC、Comf.、EP、SM-PDMS
最佳表现模型：
- NC：DiffusionDrive-Style (97.81)
- DAC：WoTE-Style (93.44)
- TTC：WoTE-Style (93.70)
- Comf.：AD-MLP-Style (99.90)
- EP：TransFuser-Style (84.95)
- SM-PDMS：DiffusionDrive-Style (84.10)

获取方式

数据集下载：https://huggingface.co/datasets/Ryhn98/StyleDrive-Dataset
模型权重下载：https://huggingface.co/datasets/Ryhn98/StyleDrive-Dataset

引用信息

bibtex @article{hao2025styledrive, title={StyleDrive: Towards Driving-Style Aware Benchmarking of End-To-End Autonomous Driving}, author={Hao, Ruiyang and Jing, Bowen and Yu, Haibao and Nie, Zaiqing}, journal={arXiv preprint arXiv:2506.23982}, year={2025} }

联系方式

联系人：Ruiyang Hao
邮箱：haory369@gmail.com

搜集汇总

数据集介绍

构建方式

StyleDrive数据集通过整合高精度地图拓扑结构、视觉语言模型（VLM）细粒度语义解析以及混合标注流程构建而成。静态场景分类基于NuPlan高清地图的手动优化，动态语义通过微调的Video-LLaMA3模型提取交互感知线索。标注流程融合规则启发式（如速度趋势分析和安全距离阈值）与VLM主观推理，最终通过人机协同验证确保标签质量，形成覆盖3万种驾驶场景的多层次标注体系。

使用方法

数据集支持端到端自动驾驶模型的风格化训练与评估，需通过半闭环仿真器（如NavSim）加载场景数据与风格标签。使用时需将驾驶风格向量（激进/保守/正常）与感知特征拼接输入规划模块，推荐采用扩散模型或Transformer架构进行条件轨迹生成。评估阶段采用Style-Modulated PDM指标，通过调整舒适度、跟车距离等子分数阈值来验证风格对齐度，同时保持基础安全性指标的恒定评估标准。

背景与挑战

背景概述

StyleDrive数据集由清华大学智能研究院（AIR）等机构的研究团队于2025年提出，旨在填补端到端自动驾驶（E2EAD）领域个性化研究的空白。该数据集基于真实世界的大规模驾驶场景，通过融合高精地图拓扑结构、视觉语言模型（VLM）的动态语义推理以及多阶段标注流程，首次实现了对多样化驾驶风格的细粒度标注。其核心研究问题是解决E2EAD系统中用户行为对齐的缺失，通过构建包含30,000个场景的标注数据集，为个性化自动驾驶模型的开发与评估提供了标准化基础，推动了以人为中心的自动驾驶研究范式转变。

当前挑战

领域挑战：1) 传统模块化自动驾驶系统难以将个性化策略迁移至端到端框架，导致驾驶风格与用户偏好脱节；2) 缺乏同时覆盖多场景连续感知-控制监督与风格标注的标准化评估协议。构建挑战：1) 驾驶风格的主观性需平衡规则启发式与VLM推理的矛盾标注；2) 动态场景中需通过风险感知融合策略解决保守/激进风格的边界模糊问题；3) 真实道路拓扑的语义增强要求对11类交通场景进行精细化地图标注与对齐。

常用场景

经典使用场景

StyleDrive数据集在端到端自动驾驶（E2EAD）领域中被广泛用于个性化驾驶行为的研究与模型评估。该数据集通过标注多样化和细粒度的驾驶偏好，为研究者提供了一个标准化的平台，用于开发和测试能够适应不同驾驶风格的自动驾驶系统。其典型应用包括驾驶风格识别、个性化轨迹预测以及驾驶行为生成模型的训练与验证。

解决学术问题

StyleDrive数据集解决了自动驾驶研究中个性化驾驶行为建模的关键问题。传统端到端自动驾驶系统往往忽视用户偏好，导致驾驶行为单一化。该数据集通过提供大规模真实世界场景下的驾驶风格标注，填补了这一空白，使得研究者能够开发出更加人性化、符合用户期望的自动驾驶模型。其意义在于推动了人本自动驾驶技术的发展，提升了系统的可信度和用户体验。

实际应用

在实际应用中，StyleDrive数据集为自动驾驶汽车的个性化功能开发提供了重要支持。基于该数据集训练的模型能够根据乘客的偏好调整驾驶风格，例如在激进、保守或正常模式间切换，从而提升乘坐舒适度和安全性。此外，该数据集还可用于自动驾驶系统的测试验证，确保不同风格下的行为符合预期，加速个性化自动驾驶技术的商业化落地。

数据集最近研究