five

WOMD-LiDAR

收藏
arXiv2024-02-19 更新2024-06-21 收录
下载链接:
https://waymo.com/open/data/motion/
下载链接
链接失效反馈
官方服务:
资源简介:
WOMD-LiDAR是由Waymo LLC创建的大规模、高质量、多样化的LiDAR数据集,专门用于自动驾驶中的运动预测任务。该数据集包含超过100,000个场景,每个场景持续20秒,涵盖了城市和郊区的多种地理环境。与Waymo Open Dataset相比,WOMD-LiDAR数据集场景数量增加了100倍。数据集的创建过程中,采用了先进的LiDAR压缩技术,将原始数据压缩了约8倍,使得最终数据集大小约为2.3TB。WOMD-LiDAR的应用领域主要集中在自动驾驶系统的运动预测模型开发,旨在通过提供丰富的原始传感器数据,提高模型的预测准确性和鲁棒性。

WOMD-LiDAR is a large-scale, high-quality, and diverse LiDAR dataset developed by Waymo LLC, exclusively tailored for motion prediction tasks in autonomous driving. This dataset comprises over 100,000 scenarios, each with a duration of 20 seconds, covering a wide range of urban and suburban geographic environments. Compared to the Waymo Open Dataset, the WOMD-LiDAR dataset boasts a 100-fold increase in the number of scenarios. During the dataset curation process, advanced LiDAR compression technologies were employed to compress the raw sensor data by a factor of approximately 8, yielding a final dataset size of around 2.3 TB. The primary application scope of WOMD-LiDAR lies in the development of motion prediction models for autonomous driving systems, where the goal is to enhance the prediction accuracy and robustness of such models by providing rich raw sensor data.
提供机构:
Waymo LLC
创建时间:
2023-04-08
搜集汇总
数据集介绍
main_image_url
构建方式
在自动驾驶运动预测领域,现有数据集多采用三维边界框与折线等抽象表征,限制了原始传感器信息的直接利用。WOMD-LiDAR通过扩展Waymo开放运动数据集,引入了大规模、高质量的激光雷达点云数据。该数据集构建过程涉及从超过10万个持续20秒的场景中采集同步校准的激光雷达数据,覆盖城市与郊区多样化地理环境。为应对海量存储挑战,研究团队应用了基于残差编码的先进激光雷达压缩技术,在保持无损量化的前提下将数据规模缩减约8倍,最终形成约2.29TB的可用数据集。
使用方法
该数据集支持以两阶段方式整合激光雷达数据至运动预测模型。首先通过预训练的SWFormer特征提取器从激光雷达点云中提取嵌入特征,随后将这些特征与边界框坐标、尺寸及前景概率等辅助信息拼接,形成多模态输入。在训练阶段,这些特征被馈入WayFormer等运动预测模型的场景编码器,通过跨模态注意力机制实现信息融合。实验表明,引入激光雷达特征可使车辆与行人预测的平均精度提升2%,验证了原始传感器数据对运动预测性能的增强作用。
背景与挑战
背景概述
在自动驾驶技术迅猛发展的背景下,运动预测作为规划系统的核心环节,其研究依赖于高质量的数据集。传统数据集如Waymo Open Motion Dataset(WOMD)通常采用三维边界框或多段线等抽象表示来替代原始传感器数据,这限制了模型对复杂场景的感知能力。为突破这一局限,Waymo LLC的研究团队于2024年发布了WOMD-LiDAR数据集,该数据集在WOMD基础上大规模增补了高质量、多样化的LiDAR点云数据,涵盖超过10万个场景,每个场景持续20秒,覆盖城市与郊区多种地理环境。WOMD-LiDAR不仅显著扩展了数据规模,还通过先进的压缩技术将原始数据体积减少约8倍,使其成为当前公开范围内最大的LiDAR数据集,旨在推动端到端运动预测模型的发展,并促进感知与预测模块的深度融合。
当前挑战
WOMD-LiDAR数据集致力于解决运动预测领域的关键挑战:传统方法依赖感知系统输出的抽象表示(如三维边界框),导致信息丢失与误差传递,难以捕捉行人姿态、视线方向等细节,且无法处理未检测对象的边缘场景。构建过程中,团队面临巨大数据存储压力,原始LiDAR数据超过20TB,需采用基于范围图像的压缩算法实现无损压缩;同时,数据集成需确保LiDAR点云与现有运动预测标签的精确同步与校准,以维持场景一致性。此外,如何有效利用原始传感器数据提升预测性能,避免感知模型成为系统瓶颈,亦是该数据集旨在探索的核心难题。
常用场景
经典使用场景
在自动驾驶运动预测领域,WOMD-LiDAR数据集为端到端学习范式提供了关键支撑。传统方法依赖感知系统输出的抽象表示,如三维边界框和折线,这些中间接口往往丢失原始传感器数据的丰富语义信息。该数据集通过提供大规模、高质量的原始激光雷达点云,使研究者能够直接基于传感器输入构建预测模型,从而探索感知与预测模块的更优耦合方式。其经典应用场景在于训练和评估能够融合多模态原始数据的运动预测算法,推动模型从依赖人工定义接口向数据驱动统一表征演进。
解决学术问题
该数据集有效应对了运动预测研究中因依赖抽象表征而产生的若干瓶颈问题。首先,它突破了传统数据集因存储限制而无法提供原始传感器数据的局限,使得研究不再受限于感知模型性能的上限。其次,通过提供包含物体姿态、视线方向等细节的原始点云,缓解了因使用简化三维框而导致的信息丢失问题,尤其有助于理解行人、骑行者等智能体的细粒度行为。此外,它支持对检测不确定性的建模,允许信息在子系统间更鲁棒地传递,为构建误差容忍的预测系统奠定了基础。
实际应用
在实际的自动驾驶系统开发中,WOMD-LiDAR数据集为提升规划模块的鲁棒性与安全性提供了数据基础。利用其包含的城市场景多样化激光雷达序列,工程师能够训练出对复杂交互和长尾场景更具适应性的预测模型。例如,模型可学习利用点云中隐含的物体形状和局部环境上下文,更准确地预测突然出现的交通参与者的轨迹,从而避免碰撞。该数据集的高质量标注与大规模场景覆盖,使其成为验证实际车载预测系统在交叉口、密集车流等挑战性场景下性能的重要基准。
数据集最近研究
最新研究方向
在自动驾驶运动预测领域,WOMD-LiDAR数据集的推出标志着研究范式正从依赖抽象中间表示转向端到端的原始传感器数据学习。该数据集通过融合大规模、高质量的激光雷达点云,为探索感知与预测一体化模型提供了前所未有的实验基础。当前前沿研究聚焦于如何高效编码原始点云中的丰富语义信息,以克服传统3D框表示带来的信息损失瓶颈。热点方向包括开发新型神经网络架构,直接利用激光雷达的几何与强度特征进行场景理解,并设计轻量化的压缩算法以应对海量数据存储挑战。这些进展将显著提升复杂交互场景下的轨迹预测精度,推动自动驾驶系统向更安全、更可靠的方向演进。
相关研究论文
  • 1
    WOMD-LiDAR: Raw Sensor Dataset Benchmark for Motion ForecastingWaymo LLC · 2024年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作