rooms_ring_camera, rooms_free_camera, jaco, shepard_metzler_7_parts, openai_block, disco_humanoid, rooms_random_objects
收藏github2024-01-05 更新2024-05-31 收录
下载链接:
https://github.com/josh-tobin/egqn-datasets
下载链接
链接失效反馈官方服务:
资源简介:
用于训练带有对极交叉注意力的生成查询网络(E-GQNs)的数据集,包括原始GQN论文中的房间环形相机、自由相机、Jaco机械臂、Shepard-Metzler 7部分、OpenAI的Block、Disco人形和随机对象房间等数据集。
A dataset for training Generative Query Networks with Epipolar Cross-Attention (E-GQNs), encompassing the datasets from the original GQN paper, including the room ring camera, free camera, Jaco robotic arm, Shepard-Metzler 7 parts, OpenAI's Block, Disco humanoid, and random object rooms.
创建时间:
2019-09-27
原始信息汇总
数据集概述
本数据集用于训练Generative Query Networks with Epipolar Cross Attention (E-GQNs),主要包含以下几个子数据集:
- rooms_ring_camera:源自原始GQN论文,用于模拟环形摄像头的房间场景。
- rooms_free_camera:源自原始GQN论文,用于模拟自由移动摄像头的房间场景。
- jaco:源自原始GQN论文,涉及机器人手臂的操作场景。
- shepard_metzler_7_parts:源自原始GQN论文,用于模拟Shepard-Metzler物体。
- openai_block:基于ShadowHand机器人与随机配置的立方体,场景外观通过随机化照明和纹理变化。
- disco_humanoid:基于Humanoid-v2环境的人形机器人,所有关节随机配置,场景外观通过随机化照明和纹理变化。
- rooms_random_objects:从ShapeNet数据集中随机选择物体,随机放置并调整其方向和外观。
数据集使用
数据集可以通过以下方式加载:
- 直接从Google Cloud Storage流式加载。
- 下载到本地后,通过指定数据集存储路径加载。
数据集下载
数据集存储于Google Cloud Storage,可通过gsutil cp命令下载。具体位置如下:
rooms_ring_camera,rooms_free_camera,jaco,shepard_metzler_7_parts位于 gqn-dataset。openai_block,disco_humanoid,rooms_random_objects位于 egqn-datasets。
搜集汇总
数据集介绍

构建方式
该数据集集合了多个用于训练生成查询网络(GQN)及其变体E-GQNs的场景数据,涵盖了从原始GQN论文中的经典数据集到基于OpenAI Gym环境的新增数据集。具体而言,rooms_ring_camera、rooms_free_camera、jaco和shepard_metzler_7_parts延续了GQN的构建方式,通过模拟不同视角下的场景生成数据。openai_block、disco_humanoid和rooms_random_objects则基于OpenAI Gym环境,通过随机化光照、纹理和物体配置生成多样化的场景数据,进一步丰富了数据集的多样性。
特点
该数据集的特点在于其多样性和复杂性,涵盖了从简单几何场景到复杂机器人操作场景的多维度数据。rooms_ring_camera和rooms_free_camera提供了固定和自由视角下的房间场景,jaco和shepard_metzler_7_parts则专注于机械臂和几何体的操作场景。新增的openai_block、disco_humanoid和rooms_random_objects通过随机化光照、纹理和物体配置,生成了更具挑战性的场景数据,为模型训练提供了更丰富的视觉信息。
使用方法
该数据集的使用方法灵活多样,支持从Google云存储直接流式加载数据,也支持本地加载。用户可以通过Python代码初始化数据集并批量获取数据,例如使用`rrc_debug()`或`rrc_train()`等函数。对于本地加载,用户需指定数据集存储路径。此外,数据集还提供了详细的下载和配置指南,用户可通过`gsutil cp`命令从Google云存储下载数据,确保在不同环境下的高效使用。
背景与挑战
背景概述
在计算机视觉与神经渲染领域,几何感知的神经渲染技术逐渐成为研究热点。由DeepMind主导的Generative Query Networks (GQNs)及其扩展E-GQNs(Epipolar Cross Attention)在2019年提出,旨在通过神经网络生成场景的三维表示。该研究基于多个数据集,包括rooms_ring_camera、rooms_free_camera、jaco、shepard_metzler_7_parts、openai_block、disco_humanoid和rooms_random_objects。这些数据集分别模拟了不同场景下的物体分布、光照变化和物理交互,为神经渲染模型的训练提供了丰富的实验环境。这些数据集的创建不仅推动了神经渲染技术的发展,也为三维场景理解与生成提供了重要的数据支持。
当前挑战
在神经渲染领域,如何从二维图像中准确重建三维场景是一个核心挑战。这些数据集旨在解决这一问题,但面临多重困难。首先,场景的复杂性和多样性对模型的泛化能力提出了极高要求,例如rooms_random_objects中随机分布的物体和动态光照条件增加了重建难度。其次,数据集的构建过程也面临技术挑战,如物理模拟的精确性、光照和纹理的随机化处理,以及大规模数据存储与传输的效率问题。此外,数据集的多样性和规模对计算资源的需求极高,如何在有限资源下高效训练模型也是一个亟待解决的问题。这些挑战不仅影响了数据集的构建与使用,也推动了相关技术的进一步发展。
常用场景
经典使用场景
在几何感知神经渲染领域,rooms_ring_camera、rooms_free_camera等数据集被广泛应用于训练生成查询网络(GQNs)。这些数据集通过提供多视角的场景图像,帮助模型学习从不同角度生成高质量的三维场景渲染。特别是在E-GQNs模型中,这些数据集被用于验证模型在复杂场景下的几何推理能力,从而提升渲染的准确性和真实感。
解决学术问题
这些数据集解决了计算机视觉和图形学中的关键问题,例如如何从有限的视角信息中重建完整的三维场景。通过提供多样化的场景和视角数据,它们为研究几何感知的神经渲染算法提供了坚实的基础。这不仅推动了生成模型的发展,还为场景理解、虚拟现实和增强现实等领域的应用提供了理论支持。
衍生相关工作
基于这些数据集,研究者们开发了多项经典工作。例如,Tobin等人提出的几何感知神经渲染(Geometry-Aware Neural Rendering)方法,利用这些数据集验证了模型在复杂场景下的渲染能力。此外,这些数据集还启发了后续研究,如基于生成模型的场景重建和视角合成技术,进一步推动了计算机视觉和图形学领域的发展。
以上内容由遇见数据集搜集并总结生成



