NavVis Indoor Dataset

github2024-04-30 更新2024-05-31 收录

下载链接：

https://github.com/NavVisResearch/NavVis-Indoor-Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

NavVis室内数据集是一个包含超过50,000张高分辨率图像的集合，覆盖了慕尼黑工业大学12个不同建筑的50,000多平方米室内空间。所有图像均在地理参考坐标系统中具有外部姿态，记录于2015年8月至2016年3月之间，涵盖了多种室内空间（如建筑风格和照明条件）。

The NavVis Indoor Dataset is a collection comprising over 50,000 high-resolution images, covering more than 50,000 square meters of indoor space across 12 different buildings at the Technical University of Munich. All images are georeferenced with external poses within a coordinate system, recorded between August 2015 and March 2016, and encompass a variety of indoor spaces (such as architectural styles and lighting conditions).

创建时间：

2017-10-18

原始信息汇总

TUM LSI Dataset 概述

数据集描述

名称: TUM LSI Dataset
来源: 慕尼黑工业大学（Technical University of Munich）
用途: 用于图像基于的室内定位研究
数据量: 包含1,314张高分辨率图像
覆盖面积: 5,575平方米，覆盖一个大学建筑的整个楼层
数据子集: TUM LSI是NavVis Indoor Dataset的一个子集
扫描ID: 2015-08-16_15.34.11
图像处理: 图像以竖屏格式存储，未旋转。处理时首先水平缩放到256像素，然后随机裁剪到224x224像素。

数据使用

研究应用: Walch et al. (2017) 使用此数据集训练和评估基于LSTM的深度学习方法，用于图像基于的室内定位。
训练与测试分割: 训练和测试集的分割信息存储在tum-lsi_train.txt和tum-lsi_test.txt文件中。

数据集组织

图像存储: 每个图像以<scan_timestamp>-<capture_location>-cam<camera_number>.jpg格式命名。
图像组: 每组包含6张图像，分别编号为cam0至cam5，代表同一捕捉位置的不同视角。
捕捉位置: 每个扫描的捕捉位置数量不等，编号从00000开始。

数据格式

图像格式: JPEG
图像尺寸: 4592 × 3448像素
位姿数据: 以XML格式存储，包含全球地理参考（WGS84）和每个扫描的局部坐标系统。

引用信息

引用文献: Walch et al. (2017) "Image-based localization using LSTMs for structured feature correlation"
会议: IEEE International Conference on Computer Vision (ICCV)

搜集汇总

数据集介绍

构建方式

NavVis Indoor Dataset的构建基于对慕尼黑工业大学多个建筑内大规模室内空间的详细扫描。该数据集包含了超过50,000张高分辨率图像，覆盖了超过50,000平方米的室内空间，涵盖了12个不同的建筑。这些图像在2015年8月至2016年3月期间采集，具有丰富的室内环境多样性，包括不同的建筑风格和光照条件。每张图像都附带有精确的地理参考坐标，确保了图像与实际空间位置的精确对应。

使用方法

使用NavVis Indoor Dataset时，用户需通过填写指定表单申请访问权限，并同意相关用户许可协议。数据集的组织结构清晰，图像和对应的姿态信息分别存储在`images`和`poses`目录下，每个扫描由唯一的时间戳标识。图像以jpeg格式存储，分辨率为4592 × 3448像素，姿态信息则以xml格式记录，包含全局地理参考和局部坐标系统的转换信息。用户可以根据需要选择特定的扫描和图像进行分析和训练。

背景与挑战

背景概述

NavVis Indoor Dataset，由慕尼黑工业大学（TUM）于2015年8月至2016年3月期间创建，是一个包含超过50,000张高分辨率图像的大型室内空间地理参考图像集合。该数据集覆盖了TUM校园内12座不同建筑的50,000多平方米，涵盖了多种室内环境，如建筑风格和光照条件的变化。其核心研究问题集中在基于图像的室内定位，旨在通过深度学习方法提升室内定位的精度和效率。Walch等人（2017）利用该数据集的子集TUM LSI Dataset，通过引入LSTM进行结构化特征相关性分析，展示了基于学习的定位方法在性能上与传统方法相当甚至更优。该数据集的发布对室内定位领域的研究产生了深远影响，为相关算法的发展提供了丰富的实验数据。

当前挑战

NavVis Indoor Dataset在构建过程中面临多项挑战。首先，数据集的规模庞大，涵盖了多种复杂的室内环境，如不同的建筑风格和光照条件，这增加了数据预处理和特征提取的难度。其次，图像的采集和地理参考的精确对齐需要高精度的设备和复杂的校准过程，以确保图像与实际空间位置的准确对应。此外，数据集的组织和存储结构复杂，涉及多个扫描时间戳和图像集的管理，要求高效的文件系统和数据访问机制。在应用层面，基于图像的室内定位面临的主要挑战包括如何在复杂多变的室内环境中实现高精度的定位，以及如何有效利用深度学习模型处理大规模数据并提升定位性能。

常用场景

经典使用场景

NavVis Indoor Dataset 的经典使用场景主要集中在基于图像的室内定位研究领域。该数据集提供了大量高分辨率的室内图像及其对应的精确地理参考坐标，使得研究者能够训练和评估深度学习模型，特别是长短期记忆网络（LSTM），用于图像特征的相关性分析。通过这些图像，研究者可以实现对室内环境的精确定位，尤其是在复杂多变的室内环境中，如大学建筑的不同楼层。

解决学术问题

NavVis Indoor Dataset 解决了室内定位领域中传统方法在复杂环境下的局限性问题。传统方法依赖于局部特征的匹配，而在光线变化、建筑风格多样等复杂条件下，这些方法往往表现不佳。该数据集通过提供大规模、多样化的室内图像，使得基于深度学习的定位方法能够在这些复杂环境中取得与传统方法相当甚至更优的性能，推动了室内定位技术的进步。

实际应用

NavVis Indoor Dataset 的实际应用场景广泛，涵盖了从智能导航系统到增强现实（AR）等多个领域。例如，在智能导航系统中，该数据集可以用于训练模型，帮助用户在大型室内空间中进行精确导航；在增强现实应用中，通过结合室内图像与地理参考信息，可以实现更加精准的虚拟物体叠加，提升用户体验。此外，该数据集还可用于室内环境的三维重建和虚拟漫游等应用。

数据集最近研究