HouseCat6D
收藏arXiv2023-12-01 更新2024-06-21 收录
下载链接:
https://sites.google.com/view/housecat6d
下载链接
链接失效反馈官方服务:
资源简介:
HouseCat6D是一个大规模多模态类别级6D物体感知数据集,包含194个不同光度复杂性的家庭对象类别和大量场景,覆盖广泛的视角分布。数据集由慕尼黑工业大学创建,包含同步的RGB、深度和极化RGB+P图像,适用于无纹理、强反射或半透明物体的场景。创建过程中,使用外部红外跟踪系统和稀疏束调整进行后续处理,以避免由时间戳偏移和运动模糊引起的误差。HouseCat6D的应用领域包括日常家庭环境中的类别级姿态估计,旨在解决现有数据集在规模、准确性和现实性方面的局限性。
HouseCat6D is a large-scale multimodal category-level 6D object perception dataset. It encompasses 194 household object categories with diverse photometric complexities, along with numerous scenes covering a broad range of viewpoint distributions. Developed by the Technical University of Munich, this dataset provides synchronized RGB, depth, and polarized RGB+P images, and is applicable to scenarios involving textureless, highly reflective or translucent objects. During the dataset construction, an external infrared tracking system and sparse bundle adjustment were adopted for post-processing to eliminate errors caused by timestamp offsets and motion blur. The application scope of HouseCat6D covers category-level pose estimation in daily household environments, and it is designed to address the limitations of existing datasets in terms of scale, accuracy and realism.
提供机构:
慕尼黑工业大学
创建时间:
2022-12-21
搜集汇总
数据集介绍

构建方式
HouseCat6D 数据集的构建过程体现了对高质量、大规模、真实场景下物体位姿估计数据集的需求。该数据集采用多模态传感器采集,包括 RGB 图像、深度图和偏振图像,涵盖了 194 个来自 10 个家庭类别的物体。数据集的采集依赖于外部红外跟踪系统和后续的后处理,如稀疏捆绑调整,以避免由自由移动的相机支架引起的时标偏移和运动模糊带来的误差。此外,数据集还包含无纹理、强反射或透光物体的场景,以及密集的抓取位姿标注。
特点
HouseCat6D 数据集具有以下特点:1) 多模态数据:包括偏振 RGB 和深度 (RGBD+P) 数据,2) 物体类别丰富:涵盖 10 个家庭类别中的 194 个物体,包括玻璃和餐具等光度挑战性类别,3) 高精度标注:位姿标注误差范围仅为 1.35 毫米至 1.74 毫米,4) 场景多样:包含 41 个大规模场景,具有广泛的视角覆盖和遮挡情况,5) 无棋盘格环境:无需使用棋盘格进行相机定位,6) 密集抓取位姿标注:为部分数据集提供了 10M 个密集的 6D 平行 jaw 机器人抓取位姿标注。
使用方法
HouseCat6D 数据集可用于以下任务:1) 类别级位姿估计:用于训练和评估类别级位姿估计网络,2) 抓取位姿估计:用于训练和评估机器人抓取位姿估计网络,3) 增强现实和机器人操作:为增强现实和机器人操作应用提供数据支持。用户可以使用 Python 等编程语言进行数据集加载和预处理,并根据任务需求选择合适的网络模型进行训练和评估。
背景与挑战
背景概述
在三维计算机视觉领域,6D物体位姿估计一直是众多任务的核心,尤其在机器人操作和增强现实等领域。为了实现这一目标,研究者们从实例级别的方法转向了更具泛化能力的类别级别位姿估计。然而,现有的类别级别数据集在标注质量和位姿多样性方面存在不足。HouseCat6D数据集应运而生,它是一个大规模的多模态类别级别6D物体位姿和抓取数据集,涵盖了不同光度和复杂性的家庭物体类别,以及具有广泛视角分布的大量场景。该数据集由房间规模的高质量相机轨迹和真实场景中无标记的物体位姿组成,包括遮挡情况以及密集的抓取位姿标注。数据包括同步的RGB、主动立体深度和极化RGB+P图像,场景中包含无纹理、强反射或透光性的物体。
当前挑战
HouseCat6D数据集面临的挑战包括:1)所解决的领域问题:类别级别位姿估计,旨在解决实例级别方法泛化能力有限的问题;2)构建过程中所遇到的挑战:实现大规模、准确和真实场景的标注,同时提供多模态数据,包括极化RGB和深度图像,以及密集的抓取位姿标注。此外,数据集构建过程中还需要克服遮挡、无纹理和反射性物体等挑战,以确保标注的准确性和多样性。
常用场景
经典使用场景
HouseCat6D 数据集是一款大规模多模态类别级 6D 物体位姿和抓取数据集,包含 194 个高质量 3D 模型的家庭物体,涵盖了透明和反光物体。该数据集适用于类别级位姿估计,旨在帮助机器人更好地理解周围环境并进行交互,例如抓取、放置、导航等。数据集包括 RGB、深度和偏振图像,以及 41 个场景中 160K 个物体位姿标注和 10M 个密集抓取标注,为机器人操作任务提供了丰富的训练数据。
实际应用
HouseCat6D 数据集在实际应用中具有广泛的应用前景,例如机器人抓取、放置、导航等。通过训练机器人模型使用该数据集,机器人可以更好地理解周围环境并进行交互,从而提高机器人的工作效率和安全性。此外,该数据集还可以用于开发新的机器人应用程序,例如家庭助理、医疗机器人等。
衍生相关工作
HouseCat6D 数据集的发布推动了类别级位姿估计领域的研究进展,并衍生了许多相关的经典工作。例如,该数据集被用于评估和改进现有的类别级位姿估计方法,并提出了新的方法来处理遮挡和纹理复杂物体。此外,该数据集还被用于开发新的机器人抓取方法,例如基于深度学习的抓取策略和基于物理模拟的抓取优化。
以上内容由遇见数据集搜集并总结生成



