ScaleMaster Dataset

Name: ScaleMaster Dataset
Creator: 韩国大邱庆北科学技术院·机器人及机电工程系
Published: 2026-02-20 20:23:46
License: 暂无描述

arXiv2026-02-20 更新2026-02-24 收录

下载链接：

https://scalemaster-dataset.github.io/

下载链接

链接失效反馈

官方服务：

资源简介：

ScaleMaster是由韩国大邱庆北科学技术院团队构建的首个专注于评估单目视觉SLAM系统尺度一致性的基准数据集。该数据集包含25条序列，涵盖多层建筑结构（如图书馆、停车场）、长轨迹（最长884米）、重复纹理场景等挑战性环境，数据通过定制采集设备（iPhone 14 Pro+LiDAR）同步获取视觉帧与高精度点云。其创新性在于系统性地揭示了现有基准未覆盖的会话内尺度漂移和会话间尺度模糊问题，通过引入Chamfer距离等三维地图质量指标，为复杂室内场景下的SLAM可靠性研究提供了关键评估工具。

ScaleMaster is the first benchmark dataset dedicated to evaluating the scale consistency of monocular visual SLAM systems, developed by the research team from Daegu Gyeongbuk Institute of Science and Technology (DGIST). This dataset includes 25 sequences spanning challenging indoor environments such as multi-story buildings (e.g., libraries, parking garages), long trajectories with a maximum length of 884 meters, and scenes with repetitive textures. Visual frames and high-precision point clouds are synchronously acquired using a custom data collection platform equipped with an iPhone 14 Pro and a LiDAR sensor. The core innovation of ScaleMaster is that it systematically reveals the intra-session scale drift and inter-session scale ambiguity issues that are not covered by existing benchmark datasets. By introducing 3D map quality evaluation metrics such as Chamfer Distance, this dataset provides a critical assessment tool for research on SLAM reliability in complex indoor scenes.

提供机构：

韩国大邱庆北科学技术院·机器人及机电工程系

创建时间：

2026-02-20

搜集汇总

数据集介绍

构建方式

在视觉SLAM领域，现有基准数据集多局限于房间尺度或结构简单的环境，难以评估大规模室内场景下的尺度一致性。为填补这一空白，ScaleMaster数据集通过定制化硬件平台构建，该平台集成了iPhone 14 Pro、Livox HAP激光雷达传感器及Orbbec Gemini 335L相机，确保了视觉帧与激光扫描间的高精度时间同步。数据采集覆盖多楼层结构、长轨迹、重复视图及低纹理区域等挑战性场景，利用ARKit框架获取厘米级精度的基线相机轨迹，并通过激光雷达点云投影生成高保真三维地图作为真值参考。最终数据集包含25个序列，其中7个序列提供稠密三维地图，其余提供轨迹真值，系统性地捕捉了室内环境中尺度漂移与模糊性的关键问题。

使用方法

该数据集主要用于评估单目视觉SLAM系统在大规模室内环境中的尺度一致性。研究人员可基于提供的序列，测试算法在长轨迹、多楼层及重复场景下的性能。使用流程包括：加载图像序列与对应真值数据，运行SLAM算法获取估计轨迹与重建地图，随后通过Sim(3)对齐计算绝对轨迹误差以评估定位精度。为进一步分析地图质量，需将算法生成的三维点云与激光雷达真值地图进行对齐，并计算Chamfer距离与丢弃率等指标，以量化几何一致性。数据集支持对帧内尺度漂移与会话间尺度模糊性的分离评估，有助于深入诊断算法失效模式并推动尺度鲁棒性研究。

背景与挑战

背景概述

随着深度学习在视觉同步定位与建图领域的深度融合，密集建图方法在实时生成精确三维地图方面展现出巨大潜力。然而，现有基准数据集如TUM-RGBD和EuRoC主要局限于房间尺度或结构简单的环境，难以系统评估大规模复杂室内场景下的尺度一致性问题。为此，韩国大邱庆北科学技术院的Hyoseok Ju、Bokeon Suh和Giseop Kim团队于2026年推出了ScaleMaster数据集，该数据集首次针对多楼层结构、长轨迹、重复视图及低纹理区域等挑战性场景，旨在深入探究单目视觉SLAM系统中存在的会话内尺度漂移与会话间尺度模糊性核心问题，为构建尺度一致且可靠的视觉SLAM系统奠定了实证基础。

当前挑战

ScaleMaster数据集致力于解决单目视觉SLAM在复杂室内环境中面临的尺度一致性问题，其核心挑战在于如何有效评估并克服会话内尺度漂移与会话间尺度模糊性。具体而言，在长轨迹、多楼层及重复结构场景中，短时数据关联的尺度漂移与Sim(3)位姿图优化的局限性导致地图几何失真；而跨会话地图融合时，不同会话间的尺度歧义性使得全局一致建图难以实现。此外，数据构建过程中需克服大规模场景数据采集的同步性难题，并设计兼顾轨迹精度与地图质量的评估指标，如引入Chamfer距离等直接地图对比度量，以揭示传统轨迹评估方法所掩盖的几何不一致性。

常用场景

经典使用场景

在视觉SLAM领域，ScaleMaster数据集专为评估单目深度视觉SLAM系统在复杂室内环境中的尺度一致性而设计。该数据集通过包含多楼层结构、长轨迹、重复视图和低纹理区域等挑战性场景，为研究人员提供了一个系统化的基准测试平台。其经典使用场景在于对现有先进算法如DROID-SLAM、MASt3R-SLAM和VGGT-SLAM进行基准评估，揭示这些系统在真实大规模室内环境中因尺度漂移和尺度模糊性导致的性能局限。

解决学术问题

ScaleMaster数据集主要解决了单目视觉SLAM中长期存在的尺度不一致性学术难题。传统基准如TUM-RGBD和EuRoC局限于房间尺度或结构简单环境，无法系统评估会话内尺度漂移和会话间尺度模糊性。该数据集通过引入直接地图到地图的质量评估指标如Chamfer距离和丢弃率，弥补了仅依赖轨迹误差如绝对轨迹误差的不足，从而更全面地揭示几何失真和尺度崩溃等隐藏问题，推动了尺度一致性SLAM系统的研究发展。

实际应用

在实际应用层面，ScaleMaster数据集对自动驾驶、机器人导航和增强现实等领域具有重要价值。这些应用依赖视觉SLAM系统在复杂室内环境如大型商场、多层图书馆和地下停车场中实现可靠定位与建图。通过暴露尺度不一致性在长轨迹和多楼层结构中的失败案例，该数据集助力开发更稳健的SLAM算法，确保在实际部署中生成几何一致且尺度准确的三维地图，提升系统在真实世界中的实用性和可靠性。

数据集最近研究