xingyoujun/ss3d
收藏Hugging Face2024-07-10 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/xingyoujun/ss3d
下载链接
链接失效反馈官方服务:
资源简介:
SS3D数据集是在一篇关于从立体图像中进行类别级物体检测、姿态估计和重建的论文中引入的。该数据集的研究重点是处理具有不同材料属性(漫反射、镜面反射、透明和混合)的日常物体的3D理解任务。现有的单目和RGB-D方法由于缺少或不精确的深度测量而存在尺度模糊问题。CODERS是一种从立体图像中进行类别级物体检测、姿态估计和重建的一阶段方法,其核心是一个隐式立体匹配模块,该模块结合了立体图像特征和3D位置信息。通过将该模块与后续的变换解码器架构结合,实现了机器人操作所需的多任务端到端学习。CODERS在公共TOD数据集上显著优于所有竞争方法,并且在模拟数据上训练后,能够很好地泛化到现实世界机器人操作实验中未见过的类别级物体实例。
The SS3D dataset is introduced in a paper on category-level object detection, pose estimation, and reconstruction from stereo images. The dataset focuses on the 3D understanding task of manipulating everyday objects with different material properties (diffuse, specular, transparent, and mixed). Existing monocular and RGB-D methods suffer from scale ambiguity due to missing or imprecise depth measurements. CODERS is a one-stage approach for category-level object detection, pose estimation, and reconstruction from stereo images, with its core being an implicit stereo matching module that combines stereo image features with 3D position information. By concatenating this module with a subsequent transform-decoder architecture, it enables end-to-end learning of multiple tasks required for robot manipulation. CODERS significantly outperforms all competing methods on the public TOD dataset and generalizes well to unseen category-level object instances in real-world robot manipulation experiments when trained on simulated data.
提供机构:
xingyoujun
原始信息汇总
SS3D 数据集
概述
- 数据集名称: SS3D
- 发布内容: 包含在论文《Category-level Object Detection, Pose Estimation and Reconstruction from Stereo Images》中介绍的数据。
研究任务
- 任务类型: 3D 物体理解
- 应用场景: 日常物体的操作,涉及不同材质属性(漫反射、镜面反射、透明和混合材质)。
- 挑战: 现有单目和RGB-D方法在缺少或不精确的深度测量下存在尺度模糊问题。
方法
- 方法名称: CODERS
- 方法描述: 一种从立体图像中进行类别级物体检测、姿态估计和重建的一阶段方法。
- 核心模块: 隐式立体匹配模块,结合立体图像特征和3D位置信息。
- 架构: 该模块与后续的变换解码器架构连接,实现机器人操作所需的多任务端到端学习。
性能
- 优势: 在公共TOD数据集上显著优于所有竞争方法。
- 泛化能力: 在模拟数据上训练后,能够很好地泛化到真实世界机器人操作实验中的未见类别级物体实例。



