SOON

github2021-11-23 更新2024-05-31 收录

下载链接：

https://github.com/ZhuFengdaaa/SOON

下载链接

链接失效反馈

官方服务：

资源简介：

场景导向对象导航数据集

Scene-Oriented Object Navigation Dataset

创建时间：

2021-04-09

原始信息汇总

数据集概述

数据集名称

Code and Data for Paper "SOON: Scenario Oriented Object Navigation with Graph-based Exploration"

数据集下载

Room-to-Room导航数据
- 下载命令：bash ./tasks/R2R/data/download.sh
环境图像特征
- 下载命令：
  
  mkdir img_features wget https://www.dropbox.com/s/715bbj8yjz32ekf/ResNet-152-imagenet.zip -P img_features/ cd img_features unzip ResNet-152-imagenet.zip

环境要求

Python版本
- 需要Python 3.6（Python 3.5也可）
Python依赖安装
- 安装命令：pip install -r python_requirements.txt
Matterport3D模拟器安装
- 安装命令：
  
  git submodule update --init --recursive sudo apt-get install libjsoncpp-dev libepoxy-dev libglm-dev libosmesa6 libosmesa6-dev libglew-dev mkdir build && cd build cmake -DEGL_RENDERING=ON .. make -j8

代码使用

扬声器训练

训练命令：bash run/speaker.bash 0
- 参数说明：0为GPU的ID，训练结果将保存在snap/speaker/目录下。

代理训练

训练命令：

python3.6 -u r2r_src/train.py --dataset SOON --maxAction 20 --log_every 500 --rl_ml_weight 1 --det_loss

评估

评估命令：sh run/eval.sh

搜集汇总

数据集介绍

构建方式

SOON数据集构建于Room-to-Room（R2R）导航数据的基础上，结合了Matterport3D模拟器中的环境信息。通过下载并解压ResNet-152预训练模型提取的图像特征，数据集进一步丰富了视觉信息的表达。数据集的构建过程包括环境安装、图像特征提取以及模拟器的配置，确保了数据的高质量和多维度特性。

使用方法

使用SOON数据集时，首先需完成环境安装和图像特征的下载与解压。随后，通过运行提供的脚本进行Speaker模型的训练，该模型用于生成导航指令。接着，使用Agent训练脚本进行导航策略的训练，结合强化学习与监督学习的方法优化模型性能。最后，通过评估脚本对模型的表现进行测试与验证，确保其在真实场景中的适用性。

背景与挑战

背景概述

SOON数据集由研究人员在2020年提出，旨在解决场景导向的对象导航问题。该数据集基于Room-to-Room（R2R）导航数据，结合了Matterport3D模拟器，专注于在复杂室内环境中进行对象导航任务。SOON的核心研究问题是通过图基探索策略，使智能体能够在未知环境中高效地定位和导航至目标对象。这一研究不仅推动了视觉导航领域的发展，还为智能机器人在实际应用中的自主导航能力提供了重要参考。

当前挑战

SOON数据集在构建和应用过程中面临多重挑战。首先，场景导向的对象导航任务要求智能体在复杂且动态变化的室内环境中进行精确导航，这对模型的感知和决策能力提出了极高要求。其次，数据集的构建依赖于高质量的3D环境数据和图像特征提取，如何有效整合多模态数据并确保其一致性是一个技术难点。此外，训练过程中需要平衡强化学习与监督学习的权重，以确保模型在探索与利用之间取得最佳平衡，这进一步增加了模型优化的复杂性。

常用场景

经典使用场景

SOON数据集主要用于场景导向的物体导航研究，特别是在室内环境中。该数据集通过结合视觉和语言信息，支持智能体在复杂的室内环境中进行导航和物体定位。研究人员可以利用该数据集训练和评估智能体在未知环境中的导航能力，尤其是在需要根据自然语言指令找到特定物体的场景中。

解决学术问题

SOON数据集解决了智能体在复杂室内环境中导航的多个学术问题，包括视觉-语言对齐、路径规划和物体定位。通过提供丰富的视觉特征和语言指令，该数据集帮助研究人员开发更高效的导航算法，提升智能体在真实环境中的自主导航能力。其意义在于推动了视觉-语言导航领域的研究进展，为未来的智能家居和机器人导航技术奠定了基础。

实际应用

SOON数据集的实际应用场景广泛，特别是在智能家居和机器人领域。通过该数据集训练的智能体可以应用于家庭服务机器人，帮助用户在复杂的室内环境中找到特定物品。此外，该数据集还可用于开发虚拟助手，使其能够根据用户的语音指令在虚拟或现实环境中进行导航和物体检索。

数据集最近研究