Waymo Open Dataset

github2022-09-21 更新2024-05-31 收录

下载链接：

https://github.com/AndyYuan96/One-time-extract-all-waymo-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

Waymo开放数据集包含高分辨率传感器数据，用于自动驾驶研究。数据集包括1000个段，每个段有200帧，数据收集率为10Hz。数据收集设置包括1个中程激光雷达和4个短程激光雷达，以及5个摄像头。数据集提供了3D和2D注释，以及详细的点云格式描述。

The Waymo Open Dataset comprises high-resolution sensor data intended for autonomous driving research. The dataset includes 1000 segments, each containing 200 frames, with a data collection rate of 10Hz. The data collection setup features one mid-range LiDAR and four short-range LiDARs, along with five cameras. The dataset provides both 3D and 2D annotations, as well as detailed descriptions of the point cloud format.

创建时间：

2019-12-08

原始信息汇总

数据集概述

数据集名称

Waymo开放数据集

数据集使用方法

安装依赖：
- 升级pip
- 安装Waymo开放数据集工具包
- 安装tqdm
下载并组织数据：
- 数据结构包括训练和验证两个主要部分，每个部分包含多个段（segment）。
运行脚本：
- 使用waymo.py脚本处理数据，需要指定根路径、保存路径和调试模式（可选）。

数据集规模

总段数：1000段
每段帧数：200帧
数据收集频率：10Hz
标注频率：10Hz

数据收集设备

Lidar：
- 1个中距离Lidar，最大探测距离75米
- 4个短距离Lidar，最大探测距离20米
相机：5个（前视和侧视）

数据组织结构

数据目录结构：
- 包含训练数据，每个段包含多个子目录，如校准信息、图像、标签、点云数据等。

标注信息

3D和2D标注：
- 3D标注在车辆坐标系中
- 2D标注在图像中

点云数据格式

通道信息：共12个通道，包括位置、强度、延伸度、NLZ标识等。
额外信息：提供6个额外的通道用于Lidar到相机的投影。

校准信息

校准矩阵：
- 每个校准文件包含5个校准矩阵，对应不同的相机视角。
- 校准矩阵用于将车辆坐标系中的点转换到图像坐标系。

数据集特点

高频率数据收集：确保数据的实时性和准确性。
多传感器融合：结合Lidar和相机数据，提供丰富的环境感知信息。
详细的标注和校准：支持精确的3D和2D对象检测和跟踪。

搜集汇总

数据集介绍

构建方式

Waymo Open Dataset的构建基于先进的自动驾驶数据采集系统，该系统配备了1个中程激光雷达和4个短程激光雷达，以及5个摄像头（包括前视和侧视摄像头）。数据采集过程中，激光雷达和摄像头同步工作，确保每帧数据的高精度同步。每个数据段包含200帧，数据采集频率为10Hz，确保了数据的连续性和高时间分辨率。此外，数据集中的每帧数据都经过详细的3D和2D标注，标注信息包括物体类别、位置、尺寸、速度等，确保了数据的高质量和高可用性。

特点

Waymo Open Dataset的显著特点在于其多模态数据融合和高度详细的标注。数据集不仅包含激光雷达点云数据，还融合了多视角摄像头图像，提供了丰富的视觉和深度信息。此外，数据集中的每帧数据都经过3D和2D标注，标注信息包括物体类别、位置、尺寸、速度等，为自动驾驶算法的研究和开发提供了全面的数据支持。数据集还特别标注了“无标签区域”（NLZ），进一步提升了数据的真实性和复杂性。

使用方法

使用Waymo Open Dataset时，首先需要通过pip安装相应的Python包，并下载数据集。数据集的组织结构清晰，分为训练集和验证集，每个集合包含多个数据段。用户可以通过提供的Python脚本进行数据处理和分析，脚本支持调试模式，便于用户进行数据验证和问题排查。数据集中的每帧数据都包含详细的标注信息，用户可以根据需要提取和分析这些信息，用于训练和验证自动驾驶算法。

背景与挑战

背景概述

Waymo Open Dataset是由Waymo公司推出的一个大规模自动驾驶数据集，旨在为自动驾驶领域的研究提供丰富的多模态数据支持。该数据集创建于近年，由Waymo的核心研发团队主导，汇集了来自多个传感器的数据，包括高精度激光雷达和多视角摄像头。其核心研究问题聚焦于自动驾驶系统中的环境感知与物体检测，通过提供高频率的标注数据（10Hz），推动了自动驾驶技术在复杂场景下的精准识别与决策能力。Waymo Open Dataset的发布对自动驾驶领域的研究产生了深远影响，为学术界和工业界提供了宝贵的实验平台，促进了相关技术的快速发展。

当前挑战

Waymo Open Dataset在构建过程中面临多项挑战。首先，数据采集的复杂性体现在多传感器融合与同步上，尤其是激光雷达与摄像头数据的精确对齐，这对数据处理算法提出了高要求。其次，数据标注的挑战在于3D与2D标注的分离处理，确保标注的准确性与一致性，尤其是在复杂场景和动态环境中的物体识别与跟踪。此外，数据集的规模庞大，处理与存储均需高效的计算资源与技术支持，尤其是在处理1000个片段、每片段200帧的高频数据时，计算与存储的瓶颈问题尤为突出。

常用场景

经典使用场景

Waymo Open Dataset 在自动驾驶领域中被广泛应用于多传感器融合的场景。该数据集通过整合激光雷达和多视角摄像头数据，提供了丰富的3D和2D标注信息，使得研究者能够开发和验证自动驾驶系统中的物体检测、跟踪和场景理解算法。其经典使用场景包括基于点云的目标检测、多传感器融合的环境感知以及自动驾驶车辆的轨迹预测等。

解决学术问题

Waymo Open Dataset 解决了自动驾驶领域中多传感器数据融合与标注一致性的学术难题。通过提供高精度的3D标注和2D图像标注，该数据集为研究者提供了统一的基准，推动了物体检测、语义分割和多目标跟踪等技术的进步。其意义在于为自动驾驶技术的研发提供了高质量的数据支持，促进了相关算法的标准化和性能提升。

衍生相关工作

基于Waymo Open Dataset，研究者们开发了多种多传感器融合算法和深度学习模型，推动了自动驾驶技术的快速发展。例如，基于该数据集的3D目标检测算法在多个国际竞赛中取得了优异成绩，进一步验证了其数据质量和应用价值。此外，该数据集还激发了关于多传感器数据对齐和标注一致性的深入研究，为自动驾驶领域的标准化和规范化提供了重要参考。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集