five

Waymo Open Dataset|自动驾驶数据集|传感器数据数据集

收藏
github2022-09-21 更新2024-05-31 收录
自动驾驶
传感器数据
下载链接:
https://github.com/AndyYuan96/One-time-extract-all-waymo-dataset
下载链接
链接失效反馈
资源简介:
Waymo开放数据集包含高分辨率传感器数据,用于自动驾驶研究。数据集包括1000个段,每个段有200帧,数据收集率为10Hz。数据收集设置包括1个中程激光雷达和4个短程激光雷达,以及5个摄像头。数据集提供了3D和2D注释,以及详细的点云格式描述。

The Waymo Open Dataset comprises high-resolution sensor data intended for autonomous driving research. The dataset includes 1000 segments, each containing 200 frames, with a data collection rate of 10Hz. The data collection setup features one mid-range LiDAR and four short-range LiDARs, along with five cameras. The dataset provides both 3D and 2D annotations, as well as detailed descriptions of the point cloud format.
创建时间:
2019-12-08
原始信息汇总

数据集概述

数据集名称

  • Waymo开放数据集

数据集使用方法

  1. 安装依赖
    • 升级pip
    • 安装Waymo开放数据集工具包
    • 安装tqdm
  2. 下载并组织数据
    • 数据结构包括训练和验证两个主要部分,每个部分包含多个段(segment)。
  3. 运行脚本
    • 使用waymo.py脚本处理数据,需要指定根路径、保存路径和调试模式(可选)。

数据集规模

  • 总段数:1000段
  • 每段帧数:200帧
  • 数据收集频率:10Hz
  • 标注频率:10Hz

数据收集设备

  • Lidar
    • 1个中距离Lidar,最大探测距离75米
    • 4个短距离Lidar,最大探测距离20米
  • 相机:5个(前视和侧视)

数据组织结构

  • 数据目录结构
    • 包含训练数据,每个段包含多个子目录,如校准信息、图像、标签、点云数据等。

标注信息

  • 3D和2D标注
    • 3D标注在车辆坐标系中
    • 2D标注在图像中

点云数据格式

  • 通道信息:共12个通道,包括位置、强度、延伸度、NLZ标识等。
  • 额外信息:提供6个额外的通道用于Lidar到相机的投影。

校准信息

  • 校准矩阵
    • 每个校准文件包含5个校准矩阵,对应不同的相机视角。
    • 校准矩阵用于将车辆坐标系中的点转换到图像坐标系。

数据集特点

  • 高频率数据收集:确保数据的实时性和准确性。
  • 多传感器融合:结合Lidar和相机数据,提供丰富的环境感知信息。
  • 详细的标注和校准:支持精确的3D和2D对象检测和跟踪。
AI搜集汇总
数据集介绍
main_image_url
构建方式
Waymo Open Dataset的构建基于先进的自动驾驶数据采集系统,该系统配备了1个中程激光雷达和4个短程激光雷达,以及5个摄像头(包括前视和侧视摄像头)。数据采集过程中,激光雷达和摄像头同步工作,确保每帧数据的高精度同步。每个数据段包含200帧,数据采集频率为10Hz,确保了数据的连续性和高时间分辨率。此外,数据集中的每帧数据都经过详细的3D和2D标注,标注信息包括物体类别、位置、尺寸、速度等,确保了数据的高质量和高可用性。
特点
Waymo Open Dataset的显著特点在于其多模态数据融合和高度详细的标注。数据集不仅包含激光雷达点云数据,还融合了多视角摄像头图像,提供了丰富的视觉和深度信息。此外,数据集中的每帧数据都经过3D和2D标注,标注信息包括物体类别、位置、尺寸、速度等,为自动驾驶算法的研究和开发提供了全面的数据支持。数据集还特别标注了“无标签区域”(NLZ),进一步提升了数据的真实性和复杂性。
使用方法
使用Waymo Open Dataset时,首先需要通过pip安装相应的Python包,并下载数据集。数据集的组织结构清晰,分为训练集和验证集,每个集合包含多个数据段。用户可以通过提供的Python脚本进行数据处理和分析,脚本支持调试模式,便于用户进行数据验证和问题排查。数据集中的每帧数据都包含详细的标注信息,用户可以根据需要提取和分析这些信息,用于训练和验证自动驾驶算法。
背景与挑战
背景概述
Waymo Open Dataset是由Waymo公司推出的一个大规模自动驾驶数据集,旨在为自动驾驶领域的研究提供丰富的多模态数据支持。该数据集创建于近年,由Waymo的核心研发团队主导,汇集了来自多个传感器的数据,包括高精度激光雷达和多视角摄像头。其核心研究问题聚焦于自动驾驶系统中的环境感知与物体检测,通过提供高频率的标注数据(10Hz),推动了自动驾驶技术在复杂场景下的精准识别与决策能力。Waymo Open Dataset的发布对自动驾驶领域的研究产生了深远影响,为学术界和工业界提供了宝贵的实验平台,促进了相关技术的快速发展。
当前挑战
Waymo Open Dataset在构建过程中面临多项挑战。首先,数据采集的复杂性体现在多传感器融合与同步上,尤其是激光雷达与摄像头数据的精确对齐,这对数据处理算法提出了高要求。其次,数据标注的挑战在于3D与2D标注的分离处理,确保标注的准确性与一致性,尤其是在复杂场景和动态环境中的物体识别与跟踪。此外,数据集的规模庞大,处理与存储均需高效的计算资源与技术支持,尤其是在处理1000个片段、每片段200帧的高频数据时,计算与存储的瓶颈问题尤为突出。
常用场景
经典使用场景
Waymo Open Dataset 在自动驾驶领域中被广泛应用于多传感器融合的场景。该数据集通过整合激光雷达和多视角摄像头数据,提供了丰富的3D和2D标注信息,使得研究者能够开发和验证自动驾驶系统中的物体检测、跟踪和场景理解算法。其经典使用场景包括基于点云的目标检测、多传感器融合的环境感知以及自动驾驶车辆的轨迹预测等。
解决学术问题
Waymo Open Dataset 解决了自动驾驶领域中多传感器数据融合与标注一致性的学术难题。通过提供高精度的3D标注和2D图像标注,该数据集为研究者提供了统一的基准,推动了物体检测、语义分割和多目标跟踪等技术的进步。其意义在于为自动驾驶技术的研发提供了高质量的数据支持,促进了相关算法的标准化和性能提升。
衍生相关工作
基于Waymo Open Dataset,研究者们开发了多种多传感器融合算法和深度学习模型,推动了自动驾驶技术的快速发展。例如,基于该数据集的3D目标检测算法在多个国际竞赛中取得了优异成绩,进一步验证了其数据质量和应用价值。此外,该数据集还激发了关于多传感器数据对齐和标注一致性的深入研究,为自动驾驶领域的标准化和规范化提供了重要参考。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录

中国农村教育发展报告

该数据集包含了中国农村教育发展的相关数据,涵盖了教育资源分布、教育质量、学生表现等多个方面的信息。

www.moe.gov.cn 收录

中国行政区划数据

本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。

github 收录

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

猫狗图像数据集

该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。

github 收录