RGB-D Frames Dataset
收藏arXiv2025-01-13 更新2025-01-15 收录
下载链接:
https://osf.io/f2seb
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由捷克技术大学的研究团队创建,旨在比较四种立体深度感知相机(Intel RealSense D435、D455、StereoLabs ZED 2和Luxonis OAK-D Pro)在机器人应用中的性能。数据集包含超过12,000帧RGB-D图像,涵盖了平面表面感知、塑料娃娃感知和YCB数据集中的家庭物品感知三种场景。数据集的创建过程包括在不同距离下记录静态场景,并通过点云分割和地面真值对比来评估相机性能。该数据集可用于机器人视觉任务中的深度感知、物体分割和抓取等应用,旨在为机器人社区提供可靠的深度感知数据基准。
This dataset was created by a research team at the Czech Technical University, aiming to compare the performance of four stereo depth perception cameras (Intel RealSense D435, D455, StereoLabs ZED 2, and Luxonis OAK-D Pro) in robotic applications. It contains over 12,000 RGB-D image frames, covering three scenarios: planar surface perception, plastic doll perception, and household object perception from the YCB dataset. The dataset creation process involved recording static scenes at varying distances, and evaluating camera performance through point cloud segmentation and ground truth comparison. This dataset can be applied to tasks such as depth perception, object segmentation, and grasping in robotic vision, and aims to provide a reliable benchmark for depth perception data within the robotics community.
提供机构:
捷克技术大学电气工程学院控制系
创建时间:
2025-01-13
搜集汇总
数据集介绍

构建方式
RGB-D Frames Dataset的构建基于四种立体深度感知相机的实验对比,包括Intel RealSense D435、Intel RealSense D455、StereoLabs ZED 2和Luxonis OAK-D Pro。实验在三种场景下进行:平面表面感知、塑料娃娃感知和家庭物体感知(YCB数据集)。每种相机记录了超过3,000帧RGB-D图像,总计超过12,000帧。数据采集过程中,相机被固定在相同高度和水平位置,通过移动物体而非相机来模拟不同距离的感知。所有数据均经过点云提取和分割处理,确保数据的准确性和一致性。
特点
该数据集的特点在于其广泛的应用场景和多样化的评估指标。数据集不仅涵盖了平面表面的感知,还包含了对复杂物体(如塑料娃娃和YCB数据集中的物体)的深度感知。通过五种不同的评估指标(如Chamfer Distance和Jaccard Similarity),数据集能够全面反映相机在不同任务中的性能表现。此外,数据集还提供了详细的相机技术参数和用户接口信息,便于研究人员根据具体需求选择合适的设备。
使用方法
RGB-D Frames Dataset的使用方法主要围绕深度感知和物体感知任务展开。研究人员可以通过该数据集评估不同相机在平面表面、复杂物体和家庭物体感知中的性能表现。数据集中的RGB-D图像和点云数据可用于训练和测试深度感知算法、物体分割模型以及机器人抓取任务中的感知模块。此外,数据集还可作为基准数据,用于验证和改进现有的RGB-D分割和物体感知算法。
背景与挑战
背景概述
RGB-D Frames Dataset是由捷克技术大学电气工程系的研究团队于2023年创建的,旨在为机器人应用中的深度感知技术提供实证比较。该数据集由Lukas Rustler、Vojtech Volprecht和Matej Hoffmann等人主导开发,得到了欧盟项目的资助。数据集的核心研究问题在于评估四种立体视觉RGB-D相机(Intel RealSense D435、D455、StereoLabs ZED 2和Luxonis OAK-D Pro)在不同场景下的性能表现,包括平面表面感知、塑料娃娃感知以及家庭物品感知(基于YCB数据集)。该数据集包含超过12,000帧RGB-D图像,涵盖了多种距离和场景,为机器人视觉、物体检测和分割等任务提供了重要的基准数据。
当前挑战
RGB-D Frames Dataset在构建和应用过程中面临多重挑战。首先,深度感知技术在复杂场景中的精度和稳定性一直是机器人领域的核心难题,尤其是在处理非平面物体或透明物体时,深度信息的获取和匹配尤为困难。其次,不同相机在硬件设计、深度计算方式和AI功能集成上的差异,使得跨设备性能比较变得复杂。在数据集的构建过程中,研究人员需要克服数据采集的标准化问题,确保不同相机在相同条件下的公平比较。此外,数据集的公开性和可重复性也面临挑战,尤其是在实验室条件与日常应用环境差异较大的情况下,如何确保数据的普适性和实用性仍需进一步探索。
常用场景
经典使用场景
RGB-D Frames Dataset 在机器人视觉和计算机视觉领域中被广泛用于深度感知和物体识别任务。该数据集通过提供超过12,000帧的RGB-D图像,涵盖了平面表面感知、塑料娃娃感知以及家庭物品感知等多种场景。这些数据为研究人员提供了丰富的实验材料,用于评估不同深度相机的性能,特别是在物体分割、三维重建和机器人抓取等任务中的应用。
解决学术问题
该数据集解决了深度感知相机在复杂场景下的性能评估问题。通过对比四种主流RGB-D相机(Intel RealSense D435、D455、StereoLabs ZED 2和Luxonis OAK-D Pro)在不同距离和场景下的表现,研究人员能够更准确地了解各相机的优缺点。数据集还提供了多种评估指标,如Chamfer距离和Jaccard相似度,帮助研究者优化物体感知和机器人操作算法。
衍生相关工作
基于RGB-D Frames Dataset,许多经典研究工作得以展开。例如,研究者利用该数据集开发了更精确的物体分割算法,并改进了三维重建技术。此外,该数据集还被用于评估不同深度相机在特定任务中的性能,如水果检测和尺寸测量。这些衍生工作进一步推动了深度感知技术在机器人学和计算机视觉领域的应用。
以上内容由遇见数据集搜集并总结生成



