NYC-Indoor-VPR

Name: NYC-Indoor-VPR
Creator: 纽约大学
Published: 2024-03-31 08:20:53
License: 暂无描述

arXiv2024-03-31 更新2024-06-21 收录

下载链接：

https://ai4ce.github.io/NYC-Indoor-VPR

下载链接

链接失效反馈

官方服务：

资源简介：

NYC-Indoor-VPR是由纽约大学创建的一个独特的室内视觉位置识别数据集，包含超过36,000张图像，这些图像来自纽约市13个不同的拥挤场景，拍摄条件多变，包括不同的光照和外观变化。数据集通过半自动标注方法建立地面实况，用于计算每张图像的位置信息。该数据集主要用于室内环境中的定位和导航研究，特别是在机器人和辅助导航系统中，旨在解决由于室内环境中的视觉重复和遮挡导致的定位难题。

NYC-Indoor-VPR is a unique indoor visual place recognition dataset created by New York University. It contains over 36,000 images captured from 13 distinct crowded indoor scenes across New York City, with variable capture conditions including different lighting and appearance changes. The dataset establishes ground truth using a semi-automatic annotation method to calculate the position information of each image. It is mainly used for research on localization and navigation in indoor environments, especially in robotics and assistive navigation systems, aiming to solve the localization challenges caused by visual repetitions and occlusions in indoor spaces.

提供机构：

纽约大学

创建时间：

2024-03-31

搜集汇总

数据集介绍

构建方式

NYC-Indoor-VPR数据集的构建方式独具匠心，通过对纽约市13个不同场景进行为期一年的图像采集，共收集了超过36,000张图像。这些场景涵盖了购物中心、教学楼、图书馆、超市和博物馆等多种室内环境，且图像采集时间跨越了不同的光照条件，真实反映了室内环境中的视觉变化。为了建立视觉定位的基准，研究团队提出了一种半自动标注方法，该方法利用视频对作为输入，通过计算每张图像的位置信息，实现了图像对的匹配及其相对位置的估计。此外，该方法还通过人工标注者的参与，对匹配的准确性进行了进一步的提升。

使用方法

NYC-Indoor-VPR数据集的使用方法主要包括两个步骤。首先，用户可以通过访问公开的数据集和基准代码，对数据集进行下载和使用。其次，用户可以利用数据集中的图像对进行视觉定位算法的训练和评估。数据集的标注信息为用户提供了准确的相对位置，使得用户能够有效地评估视觉定位算法的性能。此外，用户还可以通过对比不同场景下的图像变化，研究光照和外观变化对视觉定位算法的影响。

背景与挑战

背景概述

在视觉场景识别领域，室内视觉场景识别（VPR）对于人类和机器人来说都具有重要意义，因为它有助于更精确地进行定位和导航。然而，由于建筑内部结构重复导致的视觉外观变化以及难以获得地面实况轨迹进行训练和评估，室内VPR面临着诸多挑战。本文介绍的NYC-Indoor-VPR数据集，是一个独特的、丰富的数据集，包含超过36,000张图像，这些图像来自纽约市13个不同的拥挤场景，在不同的光照条件下拍摄，具有外观变化。每个场景在一年内都有多次回访。为了建立VPR的地面实况，本文提出了一种半自动标注方法，用于计算每张图像的位置信息。我们的方法特别以视频对作为输入，生成匹配的图像对及其估计的相对位置。通过人类的标注者使用我们的标注软件关联选定的关键帧来细化这种匹配的准确性。最后，我们使用我们的标注数据集对几种最先进的VPR算法进行了基准评估，揭示了其挑战性及其对VPR的价值。

当前挑战

NYC-Indoor-VPR数据集面临的挑战包括：1) 所解决的领域问题是室内视觉场景识别，其挑战在于感知别名效应，即不同的地方可能看起来相同，以及室内环境中视图的遮挡。2) 构建过程中遇到的挑战包括：为了建立VPR的地面实况，需要一种能够计算室内图像位置的标注方法，以有效地和准确地使用视觉序列。此外，由于室内环境通常包含多层，因此GPS坐标不足以区分位置，这也给数据集的构建带来了挑战。

常用场景

经典使用场景

NYC-Indoor-VPR数据集主要用于视觉场景识别（VPR）的研究。VPR是机器人导航和定位领域的重要技术，通过比较查询图像与数据库中的图像来实现。该数据集包含超过36,000张图像，涵盖纽约市的13个不同场景，并跨越一年的不同光照条件。这些图像的多样性使得该数据集成为测试和评估VPR算法性能的理想选择。此外，该数据集还提供了一个半自动标注方法，用于生成图像的拓扑位置信息，为VPR算法的基准测试提供了准确的地标。因此，NYC-Indoor-VPR数据集在视觉场景识别研究中具有广泛的应用价值。

解决学术问题

NYC-Indoor-VPR数据集解决了室内场景识别中的关键问题。由于室内环境的结构重复和视图遮挡，VPR算法面临着感知别名和视图遮挡的挑战。此外，获取地标性轨迹的难度也是室内VPR研究的一个难题。NYC-Indoor-VPR数据集通过提供大量标注的图像和拓扑位置信息，为研究室内VPR算法提供了准确的地标和评估基准。这使得研究人员能够更好地评估算法的性能，并针对性地解决室内VPR中的挑战。

实际应用

NYC-Indoor-VPR数据集在室内定位和导航领域具有广泛的应用前景。它可以帮助机器人在室内环境中实现更精确的定位和导航，从而提高机器人的自主性和效率。此外，该数据集还可以应用于辅助导航，为视障人士或其他需要辅助定位的人群提供帮助。NYC-Indoor-VPR数据集还适用于增强现实和虚拟现实等领域，为这些技术的进一步发展提供支持。

数据集最近研究