InCrowd-VI

github2025-01-14 更新2025-01-18 收录

下载链接：

https://github.com/banafshebamdad/InCrowd-VI

下载链接

链接失效反馈

官方服务：

资源简介：

InCrowd-VI是一个包含58个序列、跨越5公里轨迹和1.5小时记录的视觉-惯性数据集，专为评估室内行人密集环境中的SLAM系统而设计。该数据集特别旨在推进视觉障碍人士的导航技术。

InCrowd-VI is a visual-inertial dataset consisting of 58 sequences, with a total trajectory length of 5 kilometers and a total recording duration of 1.5 hours. It is specifically developed to evaluate SLAM systems in indoor crowded pedestrian environments, and is particularly aimed at advancing navigation technologies for visually impaired individuals.

创建时间：

2024-12-25

原始信息汇总

InCrowd-VI 数据集概述

数据集简介

InCrowd-VI 是一个用于评估室内行人密集环境中SLAM系统的视觉-惯性数据集。该数据集包含58个序列，覆盖5公里的轨迹和1.5小时的记录，旨在推动视觉障碍人士的导航技术发展。

数据集特点

场景多样性：数据集展示了多种挑战性场景，包括高行人密度、不同光照条件、纹理贫乏的表面、反射表面、狭窄通道和楼梯等。
数据格式：由于图像文件较大，数据集提供了每个序列的.vrs文件，用户可以使用提供的工具在本地提取所需图像。

文件结构与文档

序列文件结构：详细信息可在Sequence file structure页面查看。
校准数据：包含相机和IMU的校准参数，详见Calibration data。
序列概述：各序列的密度类别和主要挑战概述，详见InCrowd-VI sequences。

使用指南

系统要求

操作系统：Ubuntu 22.04 LTS
Python版本：3.10
系统依赖： bash sudo apt install python3.10-venv

数据提取

设置虚拟环境： bash python3 -m venv $HOME/projectaria_tools_python_env source $HOME/projectaria_tools_python_env/bin/activate
安装projectaria_tools： bash python3 -m pip install --upgrade pip python3 -m pip install projectaria-tools[all]
下载数据集：数据集序列可从InCrowd-VI Dataset下载。
提取数据：使用提供的脚本从.vrs文件中提取数据，脚本位于tools/dataset_generation目录。

数据提取脚本

bb_generate_dataset_in_loop.sh：处理多个.vrs文件。
bb_generate_sequence_ns.sh：从.vrs文件中提取并校正图像。
bb_image_undistortion.py：处理.vrs文件以提取和校正RGB和立体图像。

引用

如果使用该数据集或参考论文，请引用以下文献： bibtex @article{bamdad2024incrowd, title={InCrowd-VI: A Realistic Visual--Inertial Dataset for Evaluating Simultaneous Localization and Mapping in Indoor Pedestrian-Rich Spaces for Human Navigation}, author={Bamdad, Marziyeh and Hutter, Hans-Peter and Darvishy, Alireza}, journal={Sensors}, volume={24}, number={24}, pages={8164}, year={2024}, publisher={MDPI} }

致谢

特别感谢苏黎世大学机器人与感知小组提供用于本研究的Meta Aria眼镜。

支持

如有任何问题或遇到问题，请在issue页面创建问题，我们将尽快处理。

搜集汇总

数据集介绍

构建方式

InCrowd-VI数据集通过Meta Aria Project眼镜采集数据，涵盖了58个序列，总轨迹长度达5公里，记录时长为1.5小时。数据采集过程中，设备由行走者佩戴，捕捉了室内行人密集环境中的视觉和惯性信息。数据集以VRS文件格式存储，确保了数据的完整性和高效性。每个序列的文件结构经过精心设计，便于后续处理和提取。

特点

InCrowd-VI数据集以其丰富的场景多样性著称，涵盖了高密度行人、光照变化、纹理贫乏表面、反射表面、狭窄通道和楼梯等多种挑战性环境。这些场景设计旨在模拟真实世界中的复杂条件，特别适用于评估视觉惯性SLAM系统在室内行人密集环境中的性能。数据集还提供了详细的校准数据，确保传感器数据的精确性。

使用方法

使用InCrowd-VI数据集时，首先需在Ubuntu 22.04 LTS系统上配置Python 3.10环境，并安装`projectaria_tools`包以处理VRS文件。通过提供的脚本，用户可以从VRS文件中提取并校正图像，生成带有时间戳的RGB和立体图像。数据提取过程支持批量处理，用户可根据需求选择特定序列进行处理。详细的文件结构和脚本使用说明可在GitHub仓库中查阅。

背景与挑战

背景概述

InCrowd-VI数据集由Marziyeh Bamdad、Hans-Peter Hutter和Alireza Darvishy等研究人员于2024年发布，旨在为室内行人密集环境中的同步定位与地图构建（SLAM）系统提供评估基准。该数据集包含58个序列，覆盖5公里的轨迹和1.5小时的记录，特别关注视觉障碍者的导航技术发展。数据集通过Meta Aria Project眼镜采集，结合视觉和惯性数据，模拟真实场景中的复杂条件，如高密度行人、光照变化、纹理缺失表面等。InCrowd-VI的发布为SLAM算法在复杂室内环境中的性能评估提供了重要资源，推动了导航技术的进步。

当前挑战

InCrowd-VI数据集在解决室内行人密集环境中的SLAM问题时面临多重挑战。首先，高密度行人环境增加了动态障碍物的干扰，对算法的鲁棒性提出了更高要求。其次，光照变化和纹理缺失表面可能导致视觉特征提取困难，影响定位精度。此外，反射表面和狭窄通道等复杂场景进一步增加了数据处理的难度。在数据集构建过程中，研究人员还需克服数据采集设备校准、多传感器数据同步以及大规模数据处理等技术难题。这些挑战不仅考验了SLAM算法的性能，也为未来研究提供了改进方向。

常用场景

经典使用场景

InCrowd-VI数据集专为评估室内行人密集环境中的SLAM系统而设计，涵盖了高密度行人、多变光照条件、纹理贫乏表面、反射表面、狭窄通道和楼梯等多种挑战场景。该数据集通过58个序列、5公里的轨迹和1.5小时的记录，为研究人员提供了一个高度逼真的视觉-惯性数据集，特别适用于开发面向视障人士的导航技术。

衍生相关工作

InCrowd-VI数据集自发布以来，已衍生出多项相关研究工作，特别是在SLAM算法优化和视障人士导航技术领域。例如，基于该数据集的研究提出了新的视觉-惯性融合算法，显著提升了在复杂环境中的定位精度。此外，该数据集还被用于开发新型的导航辅助设备，进一步推动了视障人士导航技术的实际应用。

数据集最近研究