five

NYU-Depth-纽约大学各种室内场景数据集

收藏
帕依提提2024-03-04 收录
下载链接:
https://www.payititi.com/opendatasets/show-83.html
下载链接
链接失效反馈
官方服务:
资源简介:
它具有以下特点: 1、1449个密集标记的RGB和深度图像对齐对 2、来自3个城市的464个新场景 3、407,024个新的未标记帧 4、每个对象都标有一个类和一个实例号(cup1,cup2,cup3等) 数据集包含几个组成部分: 标记的:视频数据的子集,并带有密集的多类标记。此数据也已进行了预处理,以填写缺少的深度标签。 Raw:Kinect提供的原始rgb,深度和加速度计数据。 工具箱:用于处理数据和标签的有用功能。 Labeled Dataset(标记数据集) RGB相机的输出(左),预处理的深度(中心)和图像的一组标签(右)。 标记的数据集是原始数据集的子集。它由成对的RGB和深度帧组成,这些帧已同步并为每个图像标注了密集标签。除了投影的深度图,我们还包括一组预处理的深度图,其缺失值已使用Levin等人的着色方案进行了填充。与Raw数据集不同,带有标签的数据集作为Matlab .mat文件提供,具有以下变量: accelData –拍摄每帧时指示的Nx4加速度计值矩阵。列包含设备的滚动,偏航,俯仰和倾斜角。 1、depths –深度图的HxWxN矩阵,其中H和W分别是高度和宽度,N是图像数。深度元素的值以米为单位。 2、images – RGB图像的HxWx3xN矩阵,其中H和W分别是高度和宽度,N是图像数。 3、实例–实例图的HxWxN矩阵。在工具箱中使用get_instance_masks.m可以恢复场景中每个对象实例的蒙版。 4、标签–对象标签蒙版的HxWxN矩阵,其中H和W分别是高度和宽度,N是图像数。标签的范围是1..C,其中C是类的总数。如果像素的标签值为0,则该像素为“未标签”。 5、名称–每个类的英语名称的Cx1单元格数组。 6、namesToIds –从英文标签名称到类ID的映射(带有C键-值对) 7、rawDepths –原始深度图的HxWxN矩阵,其中H和W分别是高度和宽度,N是图像数。这些深度图在将深度图像投影到RGB图像平面之后但在填充缺失的深度值之前会捕获它们。此外,已删除了Kinect设备的深度非线性,并且每个深度图像的值都是以米为单位。 8、rawDepthFilenames –用于标签数据集中每个深度图像的文件名(在Raw数据集中)的Nx1单元数组。 9、rawRgbFilenames –用于标记数据集中的每个RGB图像的文件名(在Raw数据集中)的Nx1单元格数组。 10、场景–拍摄每个图像的场景名称的Nx1像元数组。 11、sceneTypes –拍摄每个图像的场景类型的Nx1像元数组。 Raw Dataset(原始数据集) RGB相机(左)和深度相机(右)的输出。深度图像中的缺失值是由于(a)由红外发射器和照相机之间的差异引起的阴影,或者(b)由镜面反射率或低反照率表面引起的随机缺失或伪造值造成的。 原始数据集包含来自kinect的原始图像和加速度计转储。 RGB和深度相机的采样率介于20到30 FPS(随时间变化)。当帧不同步时,每个RGB,深度和加速度计文件的时间戳都作为每个文件名的一部分包含在内,可以使用工具箱中的get_synched_frames.m函数进行同步以产生连续的视频。 Contact If you use the dataset, please cite the following work: Indoor Segmentation and Support Inference from RGBD Images ECCV 2012 [PDF][Bib]
提供机构:
帕依提提
二维码
社区交流群
二维码
科研交流群
商业服务