DROID-W
收藏arXiv2026-03-20 更新2026-03-21 收录
下载链接:
https://github.com/MoyangLi00/DROID-W.git
下载链接
链接失效反馈官方服务:
资源简介:
DROID-W数据集由苏黎世联邦理工学院和微软的研究团队创建,旨在为动态环境下的SLAM研究提供多样化的户外场景数据。该数据集包含通过LiDAR与RGB相机刚性组合采集的真实世界动态场景序列,并额外引入YouTube视频片段以增强'野外'场景评估的多样性。数据采集过程注重捕捉复杂动态对象和杂乱环境,弥补了现有室内基准测试的不足。该数据集主要应用于计算机视觉领域,特别是动态SLAM系统的鲁棒性测试和算法优化,旨在解决传统SLAM在未知动态对象和高度杂乱场景中性能受限的问题。
Developed by a research team from ETH Zurich and Microsoft, the DROID-W dataset is designed to provide diverse outdoor scene data for SLAM research in dynamic environments. It consists of real-world dynamic scene sequences collected via a rigidly integrated LiDAR and RGB camera rig, and additionally incorporates YouTube video clips to boost the diversity of evaluations in "wild" scenarios. The data collection process prioritizes capturing complex dynamic objects and cluttered environments, filling the gaps of existing indoor benchmark datasets. Primarily applied in the field of computer vision, particularly for robustness testing and algorithm optimization of dynamic SLAM systems, this dataset aims to address the performance constraints faced by traditional SLAM systems when dealing with unknown dynamic objects and highly cluttered scenes.
提供机构:
苏黎世联邦理工学院; 微软
创建时间:
2026-03-20
搜集汇总
数据集介绍

构建方式
在动态环境下的视觉SLAM研究中,DROID-W数据集的构建旨在填补真实世界复杂场景评估的空白。该数据集通过Livox Mid-360激光雷达与RGB相机刚性组合采集,包含7个户外序列,涵盖城市动态场景,分辨率达1200×1600,并提供同步的IMU与激光雷达测量数据。对于部分序列,采用FAST-LIVO2系统生成高精度轨迹作为地面真值,而其余序列则依赖RTK定位数据,确保了轨迹的可靠性。此外,数据集还纳入了从YouTube下载的6段高度动态视频,这些视频经过相机内参估计与分段处理,以应对长时序列的资源限制,从而构建了一个兼具多样动态对象与杂乱背景的真实世界评估基准。
使用方法
DROID-W数据集主要用于评估动态环境下的视觉SLAM系统性能,特别是在相机位姿估计与场景几何重建的准确性方面。研究者可通过加载数据集的RGB图像序列,结合提供的相机内参与地面真值轨迹,进行绝对轨迹误差(ATE)等指标的定量分析。该数据集支持与多种基线方法的对比,包括传统SLAM、动态SLAM以及基于神经辐射场与高斯溅射的SLAM系统。此外,数据集的YouTube视频部分适用于测试算法在无约束真实场景中的泛化能力,用户可通过分段处理长序列以适应计算资源,并利用估计的内参进行跨场景的鲁棒性验证。
背景与挑战
背景概述
DROID-W数据集由苏黎世联邦理工学院与微软的研究团队于2026年提出,旨在解决动态环境下视觉同时定位与地图构建(SLAM)的核心难题。传统SLAM方法通常假设场景静态,在真实世界动态物体存在时易导致跟踪失败与重建失真。该数据集通过采集户外非结构化动态视频序列,并引入YouTube真实场景片段,为动态SLAM研究提供了更具挑战性的评估基准。其创新性在于结合了不确定性感知的束调整与多视角视觉特征一致性,推动了动态SLAM在自动驾驶、机器人导航等领域的实际应用进展。
当前挑战
DROID-W数据集所应对的领域挑战在于动态环境下的鲁棒视觉SLAM,即如何在存在未知运动物体、视觉杂乱或运动模糊的场景中实现精确相机位姿估计与场景几何重建。构建过程中的挑战包括:真实世界动态数据采集的复杂性,如需同步RGB图像、LiDAR与IMU数据以确保地面真值质量;户外场景中光照变化、运动模糊与高动态范围对数据一致性的影响;以及评估序列需涵盖多样物体运动模式与场景配置,以全面检验SLAM系统在极端动态条件下的泛化能力。
常用场景
经典使用场景
在动态环境下的视觉SLAM研究中,DROID-W数据集作为评估动态感知SLAM系统性能的核心基准,其经典使用场景集中于复杂户外动态场景下的相机位姿估计与三维重建。该数据集通过捕捉真实世界中包含行人、车辆等多种动态物体的户外序列,为研究者提供了检验算法在动态干扰下鲁棒性的实验平台。典型应用包括评估SLAM系统在动态物体存在时的跟踪精度、场景几何重建质量以及不确定性估计的有效性,尤其在处理视觉特征不一致、运动模糊和光照变化等挑战时展现出独特价值。
解决学术问题
DROID-W数据集主要解决了动态环境中视觉SLAM系统因运动物体干扰导致的跟踪失败与重建退化问题。传统SLAM方法通常假设场景静态,在动态物体出现时会产生特征误匹配,从而严重降低位姿估计与地图构建的准确性。该数据集通过提供包含多样动态物体和复杂背景的户外序列,使得研究者能够开发并验证不确定性感知的优化方法,例如基于多视图视觉特征不一致性的像素级不确定性估计,从而在学术上推动了对动态SLAM中鲁棒性优化、不确定性建模以及场景表示解耦等关键问题的深入探索。
实际应用
在实际应用层面,DROID-W数据集为自动驾驶、机器人导航和增强现实等领域的动态环境感知提供了重要的验证基础。在自动驾驶场景中,车辆需要准确估计自身位姿并重建周围动态交通环境,该数据集中的户外动态序列能够帮助算法应对行人穿梭、车辆移动等复杂情况。在机器人领域,数据集支持开发能够在人群或移动物体中稳定运行的SLAM系统,提升机器人在动态环境中的自主导航能力。此外,该数据集还可用于训练和评估面向真实世界动态场景的三维重建算法,促进相关技术的实际部署与性能优化。
数据集最近研究
最新研究方向
在动态环境下的视觉SLAM领域,DROID-W数据集推动了针对未知动态对象与高度杂乱场景的鲁棒性研究。前沿工作聚焦于利用多视图视觉特征不一致性进行像素级不确定性估计,从而在无需预定义动态先验的情况下实现精确的相机轨迹与场景几何重建。该方向与神经辐射场及高斯溅射等场景表示技术的结合成为热点,旨在提升系统在真实复杂环境中的实时性能与泛化能力,对自动驾驶、机器人导航等应用具有重要影响。
相关研究论文
- 1DROID-SLAM in the Wild苏黎世联邦理工学院; 微软 · 2026年
以上内容由遇见数据集搜集并总结生成



