five

SOON|对象导航数据集|场景应用数据集

收藏
github2021-11-23 更新2024-05-31 收录
对象导航
场景应用
下载链接:
https://github.com/ZhuFengdaaa/SOON
下载链接
链接失效反馈
资源简介:
场景导向对象导航数据集

Scene-Oriented Object Navigation Dataset
创建时间:
2021-04-09
原始信息汇总

数据集概述

数据集名称

  • Code and Data for Paper "SOON: Scenario Oriented Object Navigation with Graph-based Exploration"

数据集下载

  • Room-to-Room导航数据

    • 下载命令:bash ./tasks/R2R/data/download.sh
  • 环境图像特征

    • 下载命令:

      mkdir img_features wget https://www.dropbox.com/s/715bbj8yjz32ekf/ResNet-152-imagenet.zip -P img_features/ cd img_features unzip ResNet-152-imagenet.zip

环境要求

  • Python版本

    • 需要Python 3.6(Python 3.5也可)
  • Python依赖安装

    • 安装命令:pip install -r python_requirements.txt
  • Matterport3D模拟器安装

    • 安装命令:

      git submodule update --init --recursive sudo apt-get install libjsoncpp-dev libepoxy-dev libglm-dev libosmesa6 libosmesa6-dev libglew-dev mkdir build && cd build cmake -DEGL_RENDERING=ON .. make -j8

代码使用

扬声器训练

  • 训练命令:bash run/speaker.bash 0
    • 参数说明:0为GPU的ID,训练结果将保存在snap/speaker/目录下。

代理训练

  • 训练命令:

    python3.6 -u r2r_src/train.py --dataset SOON --maxAction 20 --log_every 500 --rl_ml_weight 1 --det_loss

评估

  • 评估命令:sh run/eval.sh
AI搜集汇总
数据集介绍
main_image_url
构建方式
SOON数据集构建于Room-to-Room(R2R)导航数据的基础上,结合了Matterport3D模拟器中的环境信息。通过下载并解压ResNet-152预训练模型提取的图像特征,数据集进一步丰富了视觉信息的表达。数据集的构建过程包括环境安装、图像特征提取以及模拟器的配置,确保了数据的高质量和多维度特性。
使用方法
使用SOON数据集时,首先需完成环境安装和图像特征的下载与解压。随后,通过运行提供的脚本进行Speaker模型的训练,该模型用于生成导航指令。接着,使用Agent训练脚本进行导航策略的训练,结合强化学习与监督学习的方法优化模型性能。最后,通过评估脚本对模型的表现进行测试与验证,确保其在真实场景中的适用性。
背景与挑战
背景概述
SOON数据集由研究人员在2020年提出,旨在解决场景导向的对象导航问题。该数据集基于Room-to-Room(R2R)导航数据,结合了Matterport3D模拟器,专注于在复杂室内环境中进行对象导航任务。SOON的核心研究问题是通过图基探索策略,使智能体能够在未知环境中高效地定位和导航至目标对象。这一研究不仅推动了视觉导航领域的发展,还为智能机器人在实际应用中的自主导航能力提供了重要参考。
当前挑战
SOON数据集在构建和应用过程中面临多重挑战。首先,场景导向的对象导航任务要求智能体在复杂且动态变化的室内环境中进行精确导航,这对模型的感知和决策能力提出了极高要求。其次,数据集的构建依赖于高质量的3D环境数据和图像特征提取,如何有效整合多模态数据并确保其一致性是一个技术难点。此外,训练过程中需要平衡强化学习与监督学习的权重,以确保模型在探索与利用之间取得最佳平衡,这进一步增加了模型优化的复杂性。
常用场景
经典使用场景
SOON数据集主要用于场景导向的物体导航研究,特别是在室内环境中。该数据集通过结合视觉和语言信息,支持智能体在复杂的室内环境中进行导航和物体定位。研究人员可以利用该数据集训练和评估智能体在未知环境中的导航能力,尤其是在需要根据自然语言指令找到特定物体的场景中。
解决学术问题
SOON数据集解决了智能体在复杂室内环境中导航的多个学术问题,包括视觉-语言对齐、路径规划和物体定位。通过提供丰富的视觉特征和语言指令,该数据集帮助研究人员开发更高效的导航算法,提升智能体在真实环境中的自主导航能力。其意义在于推动了视觉-语言导航领域的研究进展,为未来的智能家居和机器人导航技术奠定了基础。
实际应用
SOON数据集的实际应用场景广泛,特别是在智能家居和机器人领域。通过该数据集训练的智能体可以应用于家庭服务机器人,帮助用户在复杂的室内环境中找到特定物品。此外,该数据集还可用于开发虚拟助手,使其能够根据用户的语音指令在虚拟或现实环境中进行导航和物体检索。
数据集最近研究
最新研究方向
在智能导航领域,SOON数据集以其场景导向的对象导航能力,成为研究热点。该数据集结合图基探索技术,为智能体在复杂环境中的导航提供了新的视角。最新研究聚焦于如何通过深度学习模型,如ResNet-152,优化图像特征的提取与理解,以提升导航的准确性和效率。此外,研究者们正探索如何将强化学习与监督学习相结合,通过调整rl_ml_weight参数,平衡探索与利用的策略,以期在多变的环境中实现更稳定的导航性能。这些研究不仅推动了智能导航技术的发展,也为实际应用如自动驾驶、机器人导航等领域提供了理论支持和技术储备。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

Arc Virtual Cell Atlas

Arc虚拟细胞图谱是一个由高质量、经过审查的开放数据集组成的集合,旨在加速虚拟细胞模型的创建。该图谱包括来自超过3.3亿个细胞(数量还在增长)的观测数据和扰动数据。

github 收录

Duke Lung Cancer Screening Dataset 2024 (DLCS 2024)

Duke Lung Cancer Screening Dataset 2024 (DLCS 2024) 是一个用于肺癌风险分类研究的数据集,随着低剂量胸部CT筛查项目的普及,该数据集变得越来越重要。

github 收录

Houston2013, Berlin, Augsburg

本研究发布了三个多模态遥感基准数据集:Houston2013(高光谱和多光谱数据)、Berlin(高光谱和合成孔径雷达数据)和Augsburg(高光谱、合成孔径雷达和数字表面模型数据)。这些数据集用于土地覆盖分类,旨在通过共享和特定特征学习模型(S2FL)评估多模态基线。数据集包含不同模态和分辨率的图像,适用于评估和开发新的遥感图像处理技术。

arXiv 收录