INTERDRIVE

Name: INTERDRIVE
Creator: 加州大学伯克利分校, NEC Labs America, 加州大学圣地亚哥分校
Published: 2025-04-16 01:14:06
License: 暂无描述

arXiv2025-04-16 更新2025-04-18 收录

下载链接：

http://arxiv.org/abs/2504.11521v1

下载链接

链接失效反馈

官方服务：

资源简介：

INTERDRIVE是一个大规模的交通场景交互行为数据集，由加州大学伯克利分校、NEC Labs America和加州大学圣地亚哥分校共同构建。该数据集通过精心设计的人类标注流程，确保高质量地捕获真实世界驾驶场景中细腻的agent-agent交互行为，如并线、跟车、让行等。数据集涵盖了来自Waymo Motion和NuPlan的两个数据集的注释，共包含150k个交互行为标注和单agent行为标注，旨在为语言条件下的交通模拟提供训练基础，推动自动驾驶车辆的安全和可靠测试。

INTERDRIVE is a large-scale interactive behavior dataset for traffic scenarios, co-developed by the University of California, Berkeley, NEC Labs America, and the University of California, San Diego. Leveraging a carefully designed human annotation pipeline, this dataset ensures high-quality capture of fine-grained agent-agent interactive behaviors in real-world driving scenarios, including lane merging, car-following, yielding, and other typical driving interactions. The dataset incorporates annotations from two existing datasets, Waymo Motion and NuPlan, and contains a total of 150k annotated instances of interactive behaviors and single-agent behaviors. It aims to provide a training foundation for language-conditioned traffic simulation, and advance the safe and reliable testing of autonomous vehicles.

提供机构：

加州大学伯克利分校, NEC Labs America, 加州大学圣地亚哥分校

创建时间：

2025-04-16

搜集汇总

数据集介绍

构建方式

INTERDRIVE数据集通过精心设计的人类标注流程和启发式标注方法构建而成，涵盖了Waymo Motion和NuPlan数据集中的多样化交通场景。人类标注过程采用多步骤框架，首先识别交互代理，然后分类主要交互类型及子类型，确保标注的精细化和一致性。启发式标注则通过预定义规则自动生成单代理行为标签，如车辆变道、行人过街等。数据集包含125k个人工标注场景和405k个启发式标注场景，确保了数据的多样性和丰富性。

特点

INTERDRIVE数据集以其高质量的语言标注和交互行为标签脱颖而出，特别关注代理间的复杂交互行为，如让行、超车和并道等。数据集通过人类专家标注和GPT-4生成的多样化语言描述，增强了语言条件的灵活性和鲁棒性。此外，数据集还包含启发式生成的单代理行为标签，为模型训练提供了全面的行为谱系。其独特的标注框架和规模使其成为语言条件交通仿真的重要资源。

使用方法

INTERDRIVE数据集主要用于训练和评估语言条件扩散模型，如LANGTRAJ。用户可以通过自然语言输入（如“向右让行”或“向左并道”）控制交通场景的生成，实现灵活的仿真测试。数据集支持闭环训练策略，通过结合真实轨迹和模型生成样本，提升仿真的真实性和稳定性。此外，数据集还可用于安全关键场景的生成，通过扩散引导技术模拟碰撞等罕见事件，为自动驾驶系统的安全测试提供丰富场景。

背景与挑战

背景概述

INTERDRIVE数据集由UC Berkeley、NEC Labs America和UC San Diego的研究团队于2025年推出，旨在支持语言条件交通仿真的研究。该数据集基于Waymo Motion和NuPlan数据集构建，包含15万条人工标注的交互行为标签和大量启发式标注的单智能体行为标签，专注于捕捉复杂的交通交互场景，如并道、让行和超车等。INTERDRIVE的推出为自动驾驶系统的测试和验证提供了丰富的语言-轨迹配对数据，推动了语言条件扩散模型在交通仿真中的应用，显著提升了仿真的多样性和可控性。

当前挑战

INTERDRIVE数据集面临的挑战主要包括两个方面：领域问题的挑战和构建过程的挑战。在领域问题方面，数据集需解决交通仿真中语言条件控制的难题，即如何将自然语言指令准确映射到多智能体的复杂交互行为上，这对模型的语义理解和行为生成能力提出了较高要求。在构建过程中，数据标注的复杂性和一致性是主要挑战，尤其是人工标注交互行为时需要处理场景理解的模糊性和标注标准的一致性，同时启发式标注的单智能体行为也需精心设计以确保覆盖各种驾驶行为。此外，数据集还需平衡多样性和真实性，以支持生成符合真实交通分布的仿真场景。

常用场景

经典使用场景

在自动驾驶系统的开发与测试中，INTERDRIVE数据集通过其丰富的语言标注轨迹数据，为研究者提供了模拟复杂交通场景的能力。该数据集特别适用于训练和验证语言条件扩散模型，如LANGTRAJ，以生成符合自然语言指令的车辆轨迹。通过这种方式，研究者能够在虚拟环境中重现多样化的驾驶行为，包括避让、变道和汇入车流等关键场景，从而显著提升自动驾驶系统的测试效率和安全性。

实际应用

在实际应用中，INTERDRIVE数据集被广泛用于自动驾驶系统的闭环测试和验证。通过结合LANGTRAJ模型，工程师能够根据自然语言指令快速生成特定场景，如紧急避障或复杂交叉路口通行。这种能力不仅加速了自动驾驶算法的迭代优化，还为法规合规性测试和极端场景验证提供了可靠的数据支持，显著降低了实车测试的成本和风险。

衍生相关工作

围绕INTERDRIVE数据集，研究者们已开展多项创新工作。例如，LANGTRAJ模型首次实现了语言条件扩散在交通仿真中的直接应用，而ProSim-Instruct则探索了基于自回归框架的目标驱动仿真。这些工作共同推动了语言条件仿真技术的发展，并为后续研究如安全关键场景生成和闭环训练策略提供了重要基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集