WOMD dataset

Name: WOMD dataset
Creator: 索邦大学
Published: 2024-11-07 20:28:52
License: 暂无描述

arXiv2024-11-07 更新2024-11-12 收录

下载链接：

https://github.com/clemgris/IGDrivSim.git

下载链接

链接失效反馈

官方服务：

资源简介：

WOMD数据集是由Waymax模拟器基于的真实世界人类驾驶数据集，包含超过570小时的驾驶数据，覆盖了美国六个城市的1,750公里道路。数据集记录了车辆、其他道路使用者和道路特征的轨迹，采样频率为10Hz，每个场景分为91个时间步长。数据集的创建旨在研究自动驾驶中的模仿学习问题，特别是模仿差距对学习驾驶策略的影响。通过引入部分可观测性约束，数据集帮助评估和改进从人类驾驶演示中学习自动驾驶策略的方法。

The WOMD dataset is a real-world human driving dataset constructed using the Waymax simulator. It contains over 570 hours of driving data, covering 1,750 kilometers of road across six cities in the United States. The dataset records the trajectories of vehicles, other road users and road features, with a sampling frequency of 10 Hz, and each scenario is divided into 91 time steps. The dataset was created to study imitation learning problems in autonomous driving, particularly the impact of the imitation gap on learning driving strategies. By introducing partial observability constraints, the dataset helps evaluate and improve methods for learning autonomous driving strategies from human driving demonstrations.

提供机构：

索邦大学

创建时间：

2024-11-07

搜集汇总

数据集介绍

构建方式

WOMD数据集的构建基于Waymo Open Motion Dataset（WOMD），该数据集包含了在六个美国城市收集的超过570小时的驾驶数据，覆盖了1,750公里的道路。数据集中的每个场景都包含了9.1秒的驾驶行为，采样频率为10Hz，共计91个时间步。这些数据通过传感器记录了车辆、其他道路使用者以及道路特征的轨迹，为模拟复杂的驾驶场景提供了丰富的信息。

特点

WOMD数据集的特点在于其高度的真实性和多样性。数据集涵盖了多种城市驾驶环境，包括不同的天气条件和交通状况，从而能够模拟真实世界中的各种驾驶挑战。此外，数据集的精细时间分辨率和详细的传感器数据记录，使得研究人员能够深入分析和理解驾驶行为，为自动驾驶系统的开发提供了宝贵的资源。

使用方法

WOMD数据集主要用于训练和验证自动驾驶系统中的行为预测模型。研究人员可以通过该数据集训练深度学习模型，以预测车辆和其他道路使用者的未来轨迹。具体使用方法包括将数据集划分为训练集和测试集，利用行为克隆（Behavioral Cloning）或结合强化学习（Reinforcement Learning）的方法进行模型训练，并通过模拟器进行验证，以评估模型在复杂驾驶环境中的表现。

背景与挑战

背景概述

WOMD数据集（Waymo Open Motion Dataset）是由Waymo公司发布的一个大规模自动驾驶数据集，旨在为自动驾驶研究提供丰富的真实世界驾驶场景。该数据集包含了超过570小时的驾驶数据，覆盖了1,750公里的道路，涵盖了六个美国城市的多样化驾驶环境。WOMD数据集的核心研究问题是如何从人类驾驶员的示范中学习自动驾驶策略，以提高自动驾驶车辆在复杂环境中的安全性和效率。该数据集的发布极大地推动了自动驾驶领域的发展，为研究人员提供了一个标准化的基准，以评估和改进模仿学习算法。

当前挑战

WOMD数据集在构建过程中面临的主要挑战之一是如何处理人类驾驶员与自动驾驶车辆之间的感知差异，即模仿学习中的‘模仿差距’。这种差距可能导致模仿学习算法无法有效学习到适合自动驾驶车辆的策略，从而影响驾驶的安全性和效率。此外，数据集的构建还需要解决数据采集、标注和模拟环境中的技术难题，以确保数据的准确性和一致性。为了应对这些挑战，研究人员需要开发新的算法和方法，以弥合模仿差距并提高自动驾驶系统的性能。

常用场景

经典使用场景

WOMD数据集在自动驾驶领域的经典使用场景主要集中在模仿学习（Imitation Learning, IL）中，通过提供真实世界的人类驾驶数据，训练自动驾驶车辆模仿人类专家的行为。这些数据集通常包含复杂的交通场景，涉及多个道路使用者的轨迹，用于预测每个代理在场景中的未来轨迹。通过在Waymax模拟器中复现这些记录的驾驶场景，研究人员能够有效地评估和改进自动驾驶策略，特别是在处理部分可观测性（partial observability）和感知差异（imitation gap）方面。

衍生相关工作

基于WOMD数据集，许多相关工作得以展开，特别是在自动驾驶策略的学习和评估方面。例如，IGDrivSim基准测试的引入，旨在研究模仿差距对自动驾驶策略学习的影响，进一步推动了这一领域的研究。此外，结合模仿学习和强化学习的混合方法，如在IGDrivSim中使用的BC-RL组合损失，展示了如何通过引入简单的惩罚奖励来缓解模仿差距带来的问题。这些工作不仅丰富了自动驾驶领域的研究工具，还为未来的技术发展提供了新的思路和方法。

数据集最近研究