InCrowd-VI
收藏arXiv2024-11-22 更新2024-11-26 收录
下载链接:
http://arxiv.org/abs/2411.14358v1
下载链接
链接失效反馈官方服务:
资源简介:
InCrowd-VI数据集由苏黎世应用科技大学应用信息研究所创建,专门用于评估室内行人密集环境中的SLAM技术,旨在为视觉障碍者的导航提供支持。该数据集包含58个序列,总轨迹长度为5公里,记录时间为1.5小时,涵盖RGB、立体图像和IMU测量数据。数据集捕捉了行人遮挡、人群密度变化、复杂布局和光照变化等现实挑战。通过Meta Aria项目眼镜记录,数据集提供了高精度的地面真实轨迹和半密集的3D点云场景,适用于评估视觉里程计和SLAM算法在复杂室内环境中的性能。
The InCrowd-VI dataset was developed by the Institute of Applied Informatics at Zurich University of Applied Sciences, specifically designed to evaluate SLAM technologies in densely crowded indoor pedestrian environments, aiming to provide navigation support for visually impaired individuals. This dataset includes 58 sequences, with a total trajectory length of 5 kilometers and a total recording duration of 1.5 hours, covering RGB, stereo images, and IMU measurement data. It captures real-world challenges such as pedestrian occlusions, varying crowd densities, complex indoor layouts, and lighting changes. Recorded using Meta Aria Project glasses, the dataset offers high-precision ground-truth trajectories and semi-dense 3D point cloud scenes, which is suitable for assessing the performance of visual odometry and SLAM algorithms in complex indoor environments.
提供机构:
苏黎世应用科技大学应用信息研究所
创建时间:
2024-11-22
搜集汇总
数据集介绍

构建方式
InCrowd-VI数据集的构建旨在填补现有视觉惯性SLAM(同步定位与地图构建)数据集在室内行人密集环境中的空白。该数据集通过Meta Aria Project眼镜记录,涵盖了机场、火车站、博物馆、大学实验室、购物中心和图书馆等多种室内公共场所。记录过程中,数据集捕捉了真实的行人运动模式和环境变化,包括RGB图像、立体图像和IMU测量数据。此外,数据集还提供了由Meta Aria项目机器感知SLAM服务生成的精确到约2厘米的地面真值轨迹,以及每个序列的半密集3D点云,以支持SLAM算法的严格评估。
特点
InCrowd-VI数据集的显著特点在于其真实性和多样性。数据集包含了58个序列,总轨迹长度达5公里,记录时间超过1.5小时,涵盖了从行人密集到静态环境的多种场景。这些场景中包含了行人遮挡、人群密度变化、复杂布局和光照变化等重要挑战。此外,数据集提供了高精度的地面真值轨迹和3D点云,使得研究人员能够在真实环境中测试和改进SLAM算法,特别是在视觉障碍者导航中的应用。
使用方法
InCrowd-VI数据集适用于评估和开发视觉惯性SLAM系统,特别是在室内行人密集环境中。研究人员可以使用数据集中的RGB图像、立体图像和IMU测量数据来训练和测试SLAM算法。数据集提供的地面真值轨迹和3D点云可以用于验证算法的准确性和鲁棒性。通过在InCrowd-VI数据集上的实验,研究人员可以识别现有SLAM系统在复杂室内环境中的局限性,并推动相关技术的进一步发展,以更好地支持视觉障碍者的导航需求。
背景与挑战
背景概述
InCrowd-VI数据集由Marziyeh Bamdad、Hans-Peter Hutter和Alireza Darvishy于2024年创建,旨在解决室内行人密集环境中同时定位与地图构建(SLAM)技术的评估问题,特别是为视觉障碍者导航提供支持。该数据集通过Meta Aria项目眼镜记录,捕捉了机场、火车站、博物馆等多样室内公共场所的真实场景,涵盖了RGB、立体图像和IMU测量数据。其核心研究问题在于解决现有数据集在复杂动态环境中的不足,为视觉SLAM算法提供更为真实的测试环境。InCrowd-VI的推出填补了这一领域的空白,对推动视觉障碍者导航技术的发展具有重要意义。
当前挑战
InCrowd-VI数据集在构建过程中面临多重挑战。首先,解决领域问题方面,该数据集需应对行人遮挡、人群密度变化、复杂建筑布局及光照变化等现实挑战,这些因素对SLAM系统的鲁棒性和准确性构成严峻考验。其次,在数据集构建过程中,如何在不控制环境的前提下,确保数据的真实性和多样性,同时提供高精度的地面真值轨迹,是另一大挑战。此外,数据集还需处理动态对象的去除和复杂场景的三维重建,以确保SLAM算法的有效评估。这些挑战共同构成了InCrowd-VI数据集的核心难点,推动了SLAM技术在复杂室内环境中的进一步发展。
常用场景
经典使用场景
InCrowd-VI数据集在室内行人密集环境中评估同步定位与地图构建(SLAM)技术方面展现了其经典应用场景。该数据集通过记录在机场、火车站、博物馆等多样的室内公共场所中的视觉和惯性数据,捕捉了真实的人类导航模式。这些数据包括RGB图像、立体图像和IMU测量,以及精确的地面真实轨迹和半密集的三维点云,为评估和改进SLAM算法提供了丰富的资源。
实际应用
InCrowd-VI数据集在实际应用中为开发适用于视觉障碍者的导航系统提供了宝贵的资源。通过模拟真实世界的复杂环境,该数据集帮助研究人员和开发者测试和优化SLAM算法,以提高其在实际导航中的准确性和鲁棒性。这些改进的算法可以集成到智能眼镜或其他可穿戴设备中,为视觉障碍者提供更安全、更独立的室内导航体验。
衍生相关工作
InCrowd-VI数据集的发布激发了大量相关研究工作,推动了视觉SLAM技术在行人密集室内环境中的应用。例如,基于该数据集的研究已经提出了多种改进的视觉里程计和SLAM算法,以应对行人遮挡、光照变化和复杂布局等挑战。此外,该数据集还促进了多传感器融合技术的研究,以提高导航系统的整体性能和可靠性。
以上内容由遇见数据集搜集并总结生成



