Waymo Open Dataset
收藏github2022-09-21 更新2024-05-31 收录
下载链接:
https://github.com/AndyYuan96/One-time-extract-all-waymo-dataset
下载链接
链接失效反馈官方服务:
资源简介:
Waymo开放数据集包含高分辨率传感器数据,用于自动驾驶研究。数据集包括1000个段,每个段有200帧,数据收集率为10Hz。数据收集设置包括1个中程激光雷达和4个短程激光雷达,以及5个摄像头。数据集提供了3D和2D注释,以及详细的点云格式描述。
The Waymo Open Dataset comprises high-resolution sensor data intended for autonomous driving research. The dataset includes 1000 segments, each containing 200 frames, with a data collection rate of 10Hz. The data collection setup features one mid-range LiDAR and four short-range LiDARs, along with five cameras. The dataset provides both 3D and 2D annotations, as well as detailed descriptions of the point cloud format.
创建时间:
2019-12-08
原始信息汇总
数据集概述
数据集名称
- Waymo开放数据集
数据集使用方法
- 安装依赖:
- 升级pip
- 安装Waymo开放数据集工具包
- 安装tqdm
- 下载并组织数据:
- 数据结构包括训练和验证两个主要部分,每个部分包含多个段(segment)。
- 运行脚本:
- 使用
waymo.py脚本处理数据,需要指定根路径、保存路径和调试模式(可选)。
- 使用
数据集规模
- 总段数:1000段
- 每段帧数:200帧
- 数据收集频率:10Hz
- 标注频率:10Hz
数据收集设备
- Lidar:
- 1个中距离Lidar,最大探测距离75米
- 4个短距离Lidar,最大探测距离20米
- 相机:5个(前视和侧视)
数据组织结构
- 数据目录结构:
- 包含训练数据,每个段包含多个子目录,如校准信息、图像、标签、点云数据等。
标注信息
- 3D和2D标注:
- 3D标注在车辆坐标系中
- 2D标注在图像中
点云数据格式
- 通道信息:共12个通道,包括位置、强度、延伸度、NLZ标识等。
- 额外信息:提供6个额外的通道用于Lidar到相机的投影。
校准信息
- 校准矩阵:
- 每个校准文件包含5个校准矩阵,对应不同的相机视角。
- 校准矩阵用于将车辆坐标系中的点转换到图像坐标系。
数据集特点
- 高频率数据收集:确保数据的实时性和准确性。
- 多传感器融合:结合Lidar和相机数据,提供丰富的环境感知信息。
- 详细的标注和校准:支持精确的3D和2D对象检测和跟踪。
搜集汇总
数据集介绍

构建方式
Waymo Open Dataset的构建基于先进的自动驾驶数据采集系统,该系统配备了1个中程激光雷达和4个短程激光雷达,以及5个摄像头(包括前视和侧视摄像头)。数据采集过程中,激光雷达和摄像头同步工作,确保每帧数据的高精度同步。每个数据段包含200帧,数据采集频率为10Hz,确保了数据的连续性和高时间分辨率。此外,数据集中的每帧数据都经过详细的3D和2D标注,标注信息包括物体类别、位置、尺寸、速度等,确保了数据的高质量和高可用性。
特点
Waymo Open Dataset的显著特点在于其多模态数据融合和高度详细的标注。数据集不仅包含激光雷达点云数据,还融合了多视角摄像头图像,提供了丰富的视觉和深度信息。此外,数据集中的每帧数据都经过3D和2D标注,标注信息包括物体类别、位置、尺寸、速度等,为自动驾驶算法的研究和开发提供了全面的数据支持。数据集还特别标注了“无标签区域”(NLZ),进一步提升了数据的真实性和复杂性。
使用方法
使用Waymo Open Dataset时,首先需要通过pip安装相应的Python包,并下载数据集。数据集的组织结构清晰,分为训练集和验证集,每个集合包含多个数据段。用户可以通过提供的Python脚本进行数据处理和分析,脚本支持调试模式,便于用户进行数据验证和问题排查。数据集中的每帧数据都包含详细的标注信息,用户可以根据需要提取和分析这些信息,用于训练和验证自动驾驶算法。
背景与挑战
背景概述
Waymo Open Dataset是由Waymo公司推出的一个大规模自动驾驶数据集,旨在为自动驾驶领域的研究提供丰富的多模态数据支持。该数据集创建于近年,由Waymo的核心研发团队主导,汇集了来自多个传感器的数据,包括高精度激光雷达和多视角摄像头。其核心研究问题聚焦于自动驾驶系统中的环境感知与物体检测,通过提供高频率的标注数据(10Hz),推动了自动驾驶技术在复杂场景下的精准识别与决策能力。Waymo Open Dataset的发布对自动驾驶领域的研究产生了深远影响,为学术界和工业界提供了宝贵的实验平台,促进了相关技术的快速发展。
当前挑战
Waymo Open Dataset在构建过程中面临多项挑战。首先,数据采集的复杂性体现在多传感器融合与同步上,尤其是激光雷达与摄像头数据的精确对齐,这对数据处理算法提出了高要求。其次,数据标注的挑战在于3D与2D标注的分离处理,确保标注的准确性与一致性,尤其是在复杂场景和动态环境中的物体识别与跟踪。此外,数据集的规模庞大,处理与存储均需高效的计算资源与技术支持,尤其是在处理1000个片段、每片段200帧的高频数据时,计算与存储的瓶颈问题尤为突出。
常用场景
经典使用场景
Waymo Open Dataset 在自动驾驶领域中被广泛应用于多传感器融合的场景。该数据集通过整合激光雷达和多视角摄像头数据,提供了丰富的3D和2D标注信息,使得研究者能够开发和验证自动驾驶系统中的物体检测、跟踪和场景理解算法。其经典使用场景包括基于点云的目标检测、多传感器融合的环境感知以及自动驾驶车辆的轨迹预测等。
解决学术问题
Waymo Open Dataset 解决了自动驾驶领域中多传感器数据融合与标注一致性的学术难题。通过提供高精度的3D标注和2D图像标注,该数据集为研究者提供了统一的基准,推动了物体检测、语义分割和多目标跟踪等技术的进步。其意义在于为自动驾驶技术的研发提供了高质量的数据支持,促进了相关算法的标准化和性能提升。
衍生相关工作
基于Waymo Open Dataset,研究者们开发了多种多传感器融合算法和深度学习模型,推动了自动驾驶技术的快速发展。例如,基于该数据集的3D目标检测算法在多个国际竞赛中取得了优异成绩,进一步验证了其数据质量和应用价值。此外,该数据集还激发了关于多传感器数据对齐和标注一致性的深入研究,为自动驾驶领域的标准化和规范化提供了重要参考。
以上内容由遇见数据集搜集并总结生成



