InCrowd-VI|SLAM技术数据集|室内导航数据集

arXiv2024-11-22 更新2024-11-26 收录

SLAM技术

室内导航

下载链接：

http://arxiv.org/abs/2411.14358v1

下载链接

链接失效反馈

资源简介：

InCrowd-VI数据集由苏黎世应用科技大学应用信息研究所创建，专门用于评估室内行人密集环境中的SLAM技术，旨在为视觉障碍者的导航提供支持。该数据集包含58个序列，总轨迹长度为5公里，记录时间为1.5小时，涵盖RGB、立体图像和IMU测量数据。数据集捕捉了行人遮挡、人群密度变化、复杂布局和光照变化等现实挑战。通过Meta Aria项目眼镜记录，数据集提供了高精度的地面真实轨迹和半密集的3D点云场景，适用于评估视觉里程计和SLAM算法在复杂室内环境中的性能。

提供机构：

苏黎世应用科技大学应用信息研究所

创建时间：

2024-11-22

AI搜集汇总

数据集介绍

构建方式

InCrowd-VI数据集的构建旨在填补现有视觉惯性SLAM（同步定位与地图构建）数据集在室内行人密集环境中的空白。该数据集通过Meta Aria Project眼镜记录，涵盖了机场、火车站、博物馆、大学实验室、购物中心和图书馆等多种室内公共场所。记录过程中，数据集捕捉了真实的行人运动模式和环境变化，包括RGB图像、立体图像和IMU测量数据。此外，数据集还提供了由Meta Aria项目机器感知SLAM服务生成的精确到约2厘米的地面真值轨迹，以及每个序列的半密集3D点云，以支持SLAM算法的严格评估。

特点

InCrowd-VI数据集的显著特点在于其真实性和多样性。数据集包含了58个序列，总轨迹长度达5公里，记录时间超过1.5小时，涵盖了从行人密集到静态环境的多种场景。这些场景中包含了行人遮挡、人群密度变化、复杂布局和光照变化等重要挑战。此外，数据集提供了高精度的地面真值轨迹和3D点云，使得研究人员能够在真实环境中测试和改进SLAM算法，特别是在视觉障碍者导航中的应用。

使用方法

InCrowd-VI数据集适用于评估和开发视觉惯性SLAM系统，特别是在室内行人密集环境中。研究人员可以使用数据集中的RGB图像、立体图像和IMU测量数据来训练和测试SLAM算法。数据集提供的地面真值轨迹和3D点云可以用于验证算法的准确性和鲁棒性。通过在InCrowd-VI数据集上的实验，研究人员可以识别现有SLAM系统在复杂室内环境中的局限性，并推动相关技术的进一步发展，以更好地支持视觉障碍者的导航需求。

背景与挑战

背景概述

InCrowd-VI数据集由Marziyeh Bamdad、Hans-Peter Hutter和Alireza Darvishy于2024年创建，旨在解决室内行人密集环境中同时定位与地图构建（SLAM）技术的评估问题，特别是为视觉障碍者导航提供支持。该数据集通过Meta Aria项目眼镜记录，捕捉了机场、火车站、博物馆等多样室内公共场所的真实场景，涵盖了RGB、立体图像和IMU测量数据。其核心研究问题在于解决现有数据集在复杂动态环境中的不足，为视觉SLAM算法提供更为真实的测试环境。InCrowd-VI的推出填补了这一领域的空白，对推动视觉障碍者导航技术的发展具有重要意义。

当前挑战

InCrowd-VI数据集在构建过程中面临多重挑战。首先，解决领域问题方面，该数据集需应对行人遮挡、人群密度变化、复杂建筑布局及光照变化等现实挑战，这些因素对SLAM系统的鲁棒性和准确性构成严峻考验。其次，在数据集构建过程中，如何在不控制环境的前提下，确保数据的真实性和多样性，同时提供高精度的地面真值轨迹，是另一大挑战。此外，数据集还需处理动态对象的去除和复杂场景的三维重建，以确保SLAM算法的有效评估。这些挑战共同构成了InCrowd-VI数据集的核心难点，推动了SLAM技术在复杂室内环境中的进一步发展。

常用场景

经典使用场景

InCrowd-VI数据集在室内行人密集环境中评估同步定位与地图构建（SLAM）技术方面展现了其经典应用场景。该数据集通过记录在机场、火车站、博物馆等多样的室内公共场所中的视觉和惯性数据，捕捉了真实的人类导航模式。这些数据包括RGB图像、立体图像和IMU测量，以及精确的地面真实轨迹和半密集的三维点云，为评估和改进SLAM算法提供了丰富的资源。

实际应用

InCrowd-VI数据集在实际应用中为开发适用于视觉障碍者的导航系统提供了宝贵的资源。通过模拟真实世界的复杂环境，该数据集帮助研究人员和开发者测试和优化SLAM算法，以提高其在实际导航中的准确性和鲁棒性。这些改进的算法可以集成到智能眼镜或其他可穿戴设备中，为视觉障碍者提供更安全、更独立的室内导航体验。

衍生相关工作

InCrowd-VI数据集的发布激发了大量相关研究工作，推动了视觉SLAM技术在行人密集室内环境中的应用。例如，基于该数据集的研究已经提出了多种改进的视觉里程计和SLAM算法，以应对行人遮挡、光照变化和复杂布局等挑战。此外，该数据集还促进了多传感器融合技术的研究，以提高导航系统的整体性能和可靠性。

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4099个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

giovannidemuri__sharegpt-ex50000-seed5_llama8b-er-v573-seed2-hx_256_ngt0.7_tp0.9

该数据集包含了用户与助手之间的对话，其中包含两个字段：用户发言和助手回应，均为字符串类型。训练集大小为38646852字节，共有44096条对话记录。

huggingface 收录

MeSH

MeSH（医学主题词表）是一个用于索引和检索生物医学文献的标准化词汇表。它包含了大量的医学术语和概念，用于描述医学文献中的主题和内容。MeSH数据集包括主题词、副主题词、树状结构、历史记录等信息，广泛应用于医学文献的分类和检索。

www.nlm.nih.gov 收录

库帕思金融大模型评测数据集（2024版）

金融大模型评测数据集（2024版），对标《金融大模型应用测评指南》（T/SAIAS 019—2024），涵盖金融行业核心领域，数据来自金融机构行业实践，是金融领域大模型应用成效评测的重要抓手。评测数据集比照最高水平、最好标准，具有规模大、结构优、价值对齐等特点，符合金融领域对知识鲜活度、多样性和高密度的整体要求。聚焦“模型基础能力”，围绕计算能力、逻辑推理等6个维度，设计评测数据22000余句对。聚焦“金融安全与价值对齐能力”，围绕信息内容、社会秩序等13个维度，设计评测数据2000余句对。聚焦“金融风险控制能力”，围绕合规、市场、操作等5类金融风险，设计评测数据1000余句对。聚焦“金融业务辅助拓展能力”，围绕舆情分析、智能投研等3项业务场景，设计评测数据12000余句对。聚焦“金融专业认知能力”，围绕金融专业知识、IPO图表等7种知识类型，设计评测数据7000余句对。金融大模型评测数据集定期更新、动态迭代，1250条样例集已在Open Data Lab完成开源。

OpenDataLab 收录

FinEval

FinEval数据集由上海财经大学创建，包含4661个高质量的多项选择题，覆盖金融、经济、会计和证书四大领域，共涉及34个不同的学术科目。数据主要来源于公开渠道的模拟考试题目，旨在评估大型语言模型在金融领域的知识和应用能力。该数据集适用于金融领域知识评估，特别是在中国语境下的应用，如金融虚拟助手和金融犯罪检测等。

arXiv 收录

Subway Dataset

该数据集包含了全球多个城市的地铁系统数据，包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统，优化地铁运营和乘客体验。