MDrive; MDrive-V2XPnP

Name: MDrive; MDrive-V2XPnP
Creator: 加利福尼亚大学·洛杉矶分校
Published: 2026-05-12 01:44:34
License: 暂无描述

arXiv2026-05-12 更新2026-05-13 收录

下载链接：

https://mdrive-challenge.github.io/

下载链接

链接失效反馈

官方服务：

资源简介：

MDrive是由加利福尼亚大学洛杉矶分校团队创建的闭环协同驾驶基准数据集，旨在系统评估多智能体系统在真实驾驶环境中的性能。该数据集包含225个多样化场景，涵盖从真实世界V2X驾驶日志转换的Real2Sim场景以及基于NHTSA预碰撞类型生成的交互场景，数据来源包括V2XPnP数据集和智能体场景生成管道。数据集通过CARLA模拟器构建，采用Real2Sim转换和智能体生成流程，确保场景的真实性和交互复杂性。该数据集主要应用于自动驾驶领域，旨在解决现有评估协议在闭环驾驶中存在的不足，推动多智能体协同感知与决策协商系统的鲁棒性和泛化能力研究。

MDrive is a closed-loop collaborative driving benchmark dataset developed by the research team at the University of California, Los Angeles (UCLA), which aims to systematically evaluate the performance of multi-agent systems in real-world driving environments. This dataset encompasses 225 diverse scenarios, including Real2Sim scenarios converted from real-world V2X driving logs and interactive scenarios generated based on NHTSA-defined pre-crash types. Its data sources cover the V2XPnP dataset and an agent scenario generation pipeline. Constructed via the CARLA simulator, the dataset adopts Real2Sim conversion and agent generation workflows to ensure the authenticity and interactive complexity of the scenarios. Primarily applied in the field of autonomous driving, this dataset is designed to address the shortcomings of existing evaluation protocols in closed-loop driving, and promote research on the robustness and generalization capabilities of multi-agent collaborative perception and decision-making negotiation systems.

提供机构：

加利福尼亚大学·洛杉矶分校

创建时间：

2026-05-12

搜集汇总

数据集介绍

构建方式

MDrive 数据集基于 CARLA 仿真器构建，包含 225 个场景，分为三个互补的类别：MDrive-InterDrive 提供无背景交通的多智能体交互场景；MDrive-Interaction 通过智能体场景生成流程，涵盖静态避让、动态避让和动态协调三种交互层级，并融入 NHTSA 预碰撞分类；MDrive-V2XPnP 采用 Real2Sim 流程，将 V2XPnP 真实驾驶日志转化为可执行的闭环仿真场景。此外，MDrive 还提供开源工具箱，支持人类在环仿真、智能体场景生成和 Real2Sim 转换，以扩展基准测试。

特点

MDrive 的核心特点在于其多样化的场景覆盖与系统性评估框架。该基准测试首次在闭环条件下系统评估多智能体协作的收益，涵盖感知共享和决策协商两种范式。场景设计基于真实世界的驾驶日志和预碰撞分类，具有高交互性和现实性。通过对比单智能体与多智能体系统，MDrive 揭示了感知共享虽能扩展感知范围，但不总能提升规划性能；而决策协商在稀疏交通中有效，但在复杂密集场景中易出现决策幻觉。

使用方法

使用 MDrive 时，研究人员可依据场景类别选择对应的评估子集，运行端到端驾驶模型。该基准测试支持闭环与开环两种评估模式，闭环评估采用驾驶分数和成功率作为指标。借助 MDrive-Toolbox，用户可自定义场景生成、导入真实世界驾驶日志进行 Real2Sim 转换，或通过人类在环接口收集专家演示。所有评估在 CARLA 中统一执行，确保可复现性。

背景与挑战

背景概述

随着车联网通信技术的蓬勃发展，多智能体协同驾驶被视为突破单车智能感知局限与决策被动性困境的关键范式。在此背景下，来自加州大学洛杉矶分校的Marco Coscoy、Zewei Zhou等研究团队于2026年提出了MDrive这一面向闭环协同驾驶的综合性基准。该基准的核心研究问题在于系统性地揭示多智能体协作——涵盖感知共享与决策协商——在真实闭环驾驶场景中究竟能带来何种程度的性能增益。MDrive由225个多样化场景构成，其来源既包括基于NHTSA碰撞前情景分类的典型长尾交互案例，也包含通过实车到仿真(Real2Sim)流水线从现实V2X驾驶日志重建的逼真环境，从而为端到端多智能体系统的泛化性与鲁棒性评估奠定了可复现的基石。

当前挑战

当前多智能体协同驾驶领域面临的核心挑战首先在于评估体系的缺失：现有基准多依赖开环评估协议，无法捕捉驾驶任务固有闭环特性中所需的失败恢复、交互适应等核心能力，导致评估结果与实际闭环性能存在显著偏差。其次，在构建过程中，研究团队需要克服三大具体困难：一是如何将真实世界V2X驾驶日志中的复杂轨迹与交通行为精准迁移至CARLA仿真环境，以实现数字孪生重建；二是如何借助大语言模型智能体自动生成并严格校验涵盖十一类交互场景的高质量测试用例，同时确保场景的难度分层与多样性覆盖；三是如何设计兼容感知共享与决策协商两种协作范式的统一评测框架，从而揭露感知改善未必等价于规划提升、协商策略在密集交通中易产生幻觉决策等深层瓶颈。

常用场景

经典使用场景

MDrive作为首个系统性评估闭环协同驾驶的基准测试，其经典使用场景聚焦于多智能体系统在真实感交互环境中的端到端规划能力评估。该基准包含225个精心设计的场景，覆盖基于NHTSA预碰撞类型学的长尾交互场景、真实世界V2X驾驶日志重建的Real2Sim场景以及无背景交通流的InterDrive场景。研究者可通过该平台在同一闭环模拟器中，对感知共享与决策协商两种协同范式进行横向对比，揭示多智能体协作在动态避障、协调穿越等复杂交通情境下相对于单智能体系统的真实增益。

解决学术问题

该数据集填补了多智能体协同驾驶领域缺乏闭环评估的空白，解决了开环指标无法准确反映实际驾驶性能的核心矛盾。通过系统性实验揭示了感知共享虽能提升感知质量，却未必能转化为更优的规划决策这一反直觉现象；同时发现基于语言模型的决策协商在密集交通场景中容易产生幻觉性决策，其优势仅局限在稀疏交互情境下。这些发现挑战了学界长期信奉的'感知越好规划越优'的假定，为后续研究指明了闭环训练与上下文感知协商的必要方向。

衍生相关工作

MDrive催生了多条重要的研究脉络：其工具箱中的实车到仿真(Real2Sim)管道为V2XPnP等真实数据集的可复现闭环评估奠定了基础；智能体场景生成管道启发了利用大语言模型自动构建长尾交互场景的新范式；而闭环评估协议则直接推动了CoDriving、CoLMDriver等协同驾驶框架的发展。此外，该基准揭示的感知-规划解耦问题与协商退化现象，已引发学界对闭环训练策略和不确定性感知协商机制的深入探索，形成了从评估到方法的良性循环。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集