five

StyleDrive

收藏
github2025-07-03 更新2025-07-04 收录
下载链接:
https://github.com/AIR-THU/StyleDrive
下载链接
链接失效反馈
官方服务:
资源简介:
我们引入了第一个大规模真实世界数据集,具有丰富的多样化驾驶偏好注释,解决了个性化端到端自动驾驶(E2EAD)中的一个关键空白。使用静态道路拓扑和微调的视觉语言模型(VLM),我们提取上下文特征以构建细粒度场景。通过行为分析、基于VLM的建模和人在环验证,得出客观和主观偏好标签。在此基础上,我们提出了第一个评估个性化E2EAD模型的基准。实验表明,基于偏好的条件会导致行为更符合人类驾驶。我们的工作为以人为中心的个性化E2EAD奠定了基础。

We introduce the first large-scale real-world dataset with rich and diverse driving preference annotations, addressing a key gap in personalized end-to-end autonomous driving (E2EAD). Utilizing static road topology and fine-tuned visual language models (VLMs), we extract contextual features to construct fine-grained scenarios. Objective and subjective preference labels are obtained through behavioral analysis, modeling based on VLMs, and human-in-the-loop validation. On this basis, we propose the first benchmark for evaluating personalized E2EAD models. Experiments show that preference-based conditioning leads to behavior that is more consistent with human driving. Our work lays the foundation for human-centered personalized E2EAD.
创建时间:
2025-06-29
原始信息汇总

StyleDrive数据集概述

基本信息

  • 数据集名称: StyleDrive: Towards Driving-Style Aware Benchmarking of End-To-End Autonomous Driving
  • 作者: Ruiyang Hao, Bowen Jing, Haibao Yu, Zaiqing Nie
  • 机构: 清华大学AIR实验室、曼彻斯特大学、香港大学
  • 发布日期: 2025年6月30日(论文)、2025年7月1日(代码和权重)
  • 论文链接: https://arxiv.org/abs/2506.23982
  • 数据集下载: https://huggingface.co/datasets/Ryhn98/StyleDrive-Dataset
  • 项目主页: https://styledrive.github.io/

数据集简介

  • 目标: 解决个性化端到端自动驾驶(E2EAD)领域的关键空白,提供首个大规模真实世界数据集,包含丰富的多样化驾驶偏好标注。
  • 特点:
    • 使用静态道路拓扑和微调的视觉语言模型(VLM)提取上下文特征,构建细粒度场景。
    • 通过行为分析、基于VLM的建模和人机验证,生成客观和主观的偏好标签。
    • 为个性化E2EAD模型评估提供首个基准。

数据集构建

  • 方法: 提出统一的框架用于建模和标注个性化驾驶偏好。
  • 流程: 包括静态道路拓扑分析、VLM特征提取、行为分析和人机验证。

基准结果

  • 评估模型: AD-MLP、TransFuser、WoTE、DiffusionDrive及其风格化版本。
  • 评估指标: NC、DAC、TTC、Comf.、EP、SM-PDMS。
  • 最佳表现模型:
    • NC: DiffusionDrive-Style (97.81)
    • DAC: WoTE-Style (93.44)
    • TTC: WoTE-Style (93.70)
    • Comf.: AD-MLP-Style (99.90)
    • EP: TransFuser-Style (84.95)
    • SM-PDMS: DiffusionDrive-Style (84.10)

使用指南

  • 环境与数据集设置: 参见docs/install.md
  • 数据集结构设计: 参见docs/dataset_illustration.md
  • 训练与评估: 参见docs/train_eval.md

联系方式

  • 联系人: Ruiyang Hao
  • 邮箱: haory369@gmail.com

引用

bibtex @article{hao2025styledrive, title={StyleDrive: Towards Driving-Style Aware Benchmarking of End-To-End Autonomous Driving}, author={Hao, Ruiyang and Jing, Bowen and Yu, Haibao and Nie, Zaiqing}, journal={arXiv preprint arXiv:2506.23982}, year={2025} }

搜集汇总
数据集介绍
main_image_url
构建方式
在自动驾驶领域,个性化驾驶风格的建模一直是研究难点。StyleDrive数据集通过整合静态道路拓扑结构和经过微调的视觉语言模型(VLM),构建了一个包含丰富驾驶偏好标注的大规模真实世界数据集。研究团队采用行为分析和VLM建模相结合的方法提取上下文特征,并通过人机协同验证流程生成客观与主观的驾驶偏好标签,最终形成细粒度的驾驶场景标注体系。
特点
该数据集作为首个面向端到端自动驾驶的个性化驾驶风格基准测试,具有显著的多维特性。其不仅包含常规的驾驶行为数据,还创新性地引入了基于视觉语言模型生成的风格描述标签,以及经过严格验证的人类驾驶偏好指标。数据集通过量化指标如舒适度(Comf.)和轨迹一致性(EP)等,实现了对驾驶风格的多角度评估,为个性化自动驾驶算法研究提供了全面的验证基础。
使用方法
研究人员可通过Hugging Face平台获取完整的StyleDrive数据集及预训练模型权重。数据集采用模块化结构设计,包含原始传感器数据、标注文件以及风格条件参数。使用流程建议先配置专用开发环境,继而参考提供的训练评估脚本进行模型微调。特别值得注意的是,该数据集支持通过风格条件向量控制模型输出,用户可根据需求调整驾驶风格的激进或保守程度,实现个性化的自动驾驶行为生成。
背景与挑战
背景概述
StyleDrive数据集由清华大学智能研究院(AIR)联合曼彻斯特大学和香港大学的研究团队于2025年推出,旨在填补个性化端到端自动驾驶(E2EAD)领域的研究空白。该数据集首次大规模整合了真实驾驶场景中多样化的驾驶偏好标注,通过静态道路拓扑和微调视觉语言模型(VLM)提取上下文特征,构建细粒度场景。研究团队采用行为分析、VLM建模及人机协同验证等方法,获取客观与主观偏好标签,为建立人类中心主义的个性化自动驾驶系统奠定基础。该数据集的发布推动了驾驶风格自适应算法的研究进程,对提升自动驾驶系统的人机协同性能具有里程碑意义。
当前挑战
构建StyleDrive数据集面临双重技术挑战。在领域问题层面,需解决驾驶风格量化表征的难题——传统自动驾驶基准测试主要关注通用场景下的基础性能指标,而个性化驾驶涉及多维度的主观偏好(如激进型/保守型决策),其动态性和模糊性导致标准化评估体系构建困难。在数据构建层面,真实驾驶场景的偏好标注存在显著复杂性:静态道路特征与动态驾驶行为的关联建模需要融合多模态传感器数据;人类验证环节中标注者主观差异可能引入噪声,需设计分层抽样和交叉验证机制确保标签一致性。此外,大规模驾驶数据的时空异质性也对场景泛化能力提出更高要求。
常用场景
经典使用场景
在自动驾驶领域,StyleDrive数据集为研究者提供了一个独特的平台,用于探索和评估不同驾驶风格对端到端自动驾驶系统的影响。该数据集通过丰富的驾驶偏好标注,使得研究者能够在多样化的驾驶场景中进行模型训练和测试,从而深入理解驾驶风格如何影响自动驾驶决策。
实际应用
在实际应用中,StyleDrive数据集可用于开发更加个性化和人性化的自动驾驶系统。例如,汽车制造商可以利用该数据集训练模型,使其能够根据乘客的偏好调整驾驶风格,从而提升乘坐舒适度和安全性。
衍生相关工作
StyleDrive数据集已经催生了一系列相关研究,包括基于视觉语言模型的驾驶风格建模、端到端自动驾驶系统的个性化优化等。这些工作进一步推动了自动驾驶领域的技术进步,为未来的智能交通系统奠定了基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作