LHPR-VLN

Hugging Face2025-03-26 更新2025-03-27 收录

下载链接：

https://huggingface.co/datasets/Starry123/LHPR-VLN

下载链接

链接失效反馈

官方服务：

资源简介：

LHPR-VLN基准是一个长距离视觉语言导航任务的数据集，包含完整的任务轨迹和对应的逐步导航任务配置。数据集按照批次组织，每个批次包含不同数量的导航阶段，任务配置详细描述了任务指令、子任务、机器人类型、场景、目标和初始位置等信息。

The LHPR-VLN benchmark is a dataset for long-range visual-language navigation (VLN) tasks, which contains complete task trajectories and corresponding step-by-step navigation task configurations. The dataset is organized in batches, with each batch containing a varying number of navigation stages. The task configurations detail information such as task instructions, subtasks, robot types, scenes, target objects and initial positions.

创建时间：

2025-03-21

搜集汇总

数据集介绍

构建方式

LHPR-VLN数据集作为视觉语言导航领域的重要基准，其构建过程体现了严谨的层次化设计理念。数据集通过8个批次的任务轨迹进行组织，每个批次进一步细分为2-4个导航阶段，采用多视角图像采集策略（-60°、0°、+60°）记录智能体在每个动作执行后的环境观测。任务配置采用JSON格式封装，包含自然语言指令、任务分解结构、机器人类型、场景ID等元数据，其中场景数据源自HM3D数据集并保留区域-对象语义关联。特别值得注意的是，batch_6至batch_8还额外集成了深度信息，为三维环境理解提供了更丰富的数据维度。

特点

该数据集最显著的特征在于其长时程规划与推理能力评估的定位，通过包含2-4个导航阶段的复合任务设计，有效模拟现实世界中复杂的多步骤交互场景。数据组织形式兼具整体任务轨迹与分步导航任务的对应关系，支持从宏观规划到微观执行的多粒度研究。场景划分采用800为界的显式分离策略，同时提供seen/unseen两种评估模式，确保算法泛化能力的全面验证。深度信息的引入进一步拓展了数据集在三维空间理解方面的应用潜力，使其成为当前视觉语言导航领域最具系统性的基准之一。

使用方法

使用该数据集时，研究者可通过task/目录下的完整任务轨迹开展端到端导航算法训练，或利用step_task/中的分步任务进行模块化研究。每个任务包包含三视角视觉观测、动作序列及语义配置，支持基于强化学习或模仿学习的训练范式。评估阶段需严格遵循数据集划分规则，unseen模式下以场景ID800为界划分训练验证集，seen模式则采用batch_7-8作为测试集。深度数据可用于开发多模态导航模型，而分步指令则为可解释性研究提供天然标注。通过配套的语义接口，可便捷实现对象区域关联查询，极大简化环境语义理解流程。

背景与挑战

背景概述

LHPR-VLN数据集由中山大学HCP实验室于2024年提出，旨在推动视觉语言导航（VLN）领域的长时程规划与推理研究。该数据集基于HM3D场景构建，包含多阶段导航任务和分步导航子任务，通过Spot机器人采集的三视角图像序列与结构化指令数据，解决了传统VLN任务在复杂场景下长时程规划能力不足的核心问题。作为CVPR 2025会议成果，其创新性的任务分解机制和跨模态关联设计为智能体在真实环境中的长期决策提供了重要基准。

当前挑战

该数据集面临双重技术挑战：在领域问题层面，长时程导航任务需解决跨区域语义关联、动态路径规划与多模态指令对齐等复杂问题，现有模型在超过4个导航阶段的成功率显著下降；在构建过程中，精确标注数千个分步动作的三维位姿、确保多视角图像与语义区域的一致性，以及处理不同机器人平台的传感器差异，均对数据质量提出了严格要求。深度信息的引入虽增强环境感知，但也带来了跨模态数据同步与标定的新挑战。

常用场景

经典使用场景

在视觉语言导航（VLN）领域，LHPR-VLN数据集为研究长期规划和复杂推理任务提供了重要支持。该数据集通过多阶段导航任务和丰富的视觉观察数据，使得研究者能够模拟真实环境中机器人执行复杂指令的过程。其经典使用场景包括训练和评估智能体在长时程、多步骤导航任务中的表现，特别是在需要结合视觉感知和语言理解的场景中。

实际应用

在实际应用中，LHPR-VLN数据集可服务于家庭服务机器人、智能仓储物流等场景。通过模拟真实环境中的多步骤导航任务，该数据集能够帮助开发具备长期规划和语义理解能力的机器人系统。例如，在家庭环境中，机器人可根据复杂指令完成物品搬运等任务，展现了数据集在推动实际应用中的潜力。

衍生相关工作

围绕LHPR-VLN数据集，研究者已展开多项经典工作，包括长期规划算法、跨模态融合模型以及导航策略优化等方向。这些工作充分利用数据集提供的多阶段任务和深度信息，推动了视觉语言导航领域的技术进步。相关成果已在计算机视觉和机器人领域的顶级会议和期刊上发表，形成了以长期规划为核心的研究脉络。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集