five

COLE-Ricoh/ToF-360|室内场景理解数据集|RGB-D图像数据集

收藏
hugging_face2024-06-17 更新2024-06-15 收录
室内场景理解
RGB-D图像
下载链接:
https://hf-mirror.com/datasets/COLE-Ricoh/ToF-360
下载链接
链接失效反馈
资源简介:
ToF-360数据集由包含实例级语义和房间布局注释的球形RGB-D图像组成,包含4个独特的场景。数据集包含179个等距圆柱投影的RGB图像及其对应的深度、表面法线、XYZ图像和HHA图像,这些图像被标记了建筑定义的对象类别和基于图像的布局边界(天花板-墙,墙-地板)。数据集支持基于单次重建的场景理解任务,无需在室内空间中进行全局对齐。数据集的各种模态包括RGB图像、曼哈顿对齐的RGB图像、深度图像、XYZ图像、法线图像和HHA图像,每种模态都有详细的存储格式和预处理方法。数据集还提供了注释和房间布局注释,使用了COCO Annotator和PanoAnnotator工具进行标注。

The ToF-360 dataset consists of spherical RGB-D images with instance-level semantic and room layout annotations, which include 4 unique scenes. It contains 179 equirectangular RGB images along with the corresponding depths, surface normals, XYZ images, and HHA images, labeled with building-defining object categories and image based layout boundaries (ceiling-wall, wall-floor). The dataset enables development of scene understanding tasks based on single-shot reconstruction without the need for global alignment in indoor spaces. The dataset modalities include RGB images, Manhattan aligned RGB images, depth images, XYZ images, normal images, and HHA images, each with detailed storage formats and preprocessing methods. The dataset also provides annotations and room layout annotations, using COCO Annotator and PanoAnnotator tools for labeling.
提供机构:
COLE-Ricoh
原始信息汇总

ToF-360 数据集

概述

ToF-360 数据集包含具有实例级语义和房间布局注释的球形 RGB-D 图像,涵盖 4 个独特的场景。该数据集包含 179 张等距柱状 RGB 图像及其对应的深度、表面法线、XYZ 图像和 HHA 图像,标记了建筑定义对象类别和基于图像的布局边界(天花板-墙、墙-地板)。该数据集支持基于单次重建的场景理解任务,无需室内空间的全局对齐。

数据集模态

每个场景在数据集中都有自己的文件夹。每个区域的模态都包含在该文件夹中,格式为 <场景>/<模态>

RGB 图像:
RGB 图像包含等距柱状的 24 位彩色图像,由传感器拍摄的原始双鱼眼图像转换而来。

曼哈顿对齐的 RGB 图像:
我们遵循 [LGT-Net] 提出的预处理代码创建曼哈顿对齐的 RGB 图像。数据集的示例代码位于 assets/preprocessing/align_manhattan.py

深度图像:
深度图像存储为 16 位灰度 PNG 图像,最大深度为 128 米,灵敏度为 1/512 米。缺失值用 0 表示。注意,深度定义为从相机点中心到全景图中的点的距离。

XYZ 图像:
XYZ 图像保存为 NumPy.npy 二进制文件格式,包含空间中像素对齐的数据点集,灵敏度为毫米。其大小必须为 (高度, 宽度, 3[xyz])。

法线图像:
法线是每通道表面法线图像,以 127.5 为中心。法线向量保存为 24 位 RGB PNG 图像,其中红色表示水平值(越红向右),绿色表示垂直值(越绿向下),蓝色表示朝向相机。法线是通过 Open3D 中的 法线估计函数 计算的。从 3D 创建法线图像的工具位于 assets/preprocessing/depth2normal.py

HHA 图像:
HHA 图像包含水平视差、离地高度和与重力角度的信息。我们遵循 Depth2HHA-python 创建它。代码位于 assets/preprocessing/getHHA.py

注释:
我们使用 COCO Annotator 对 RGB 数据进行标注。我们遵循为 RGB-D 和点云数据开发的 基于本体的注释指南<场景>/注释 包含 json 格式的文件,<场景>/语义<场景>/实例 包含保存为 .npy 二进制文件的图像类标注数据。

房间布局注释:
房间布局注释以与 PanoAnnotator 相同的 json 格式存储。有关更多详细信息,请参阅该仓库。

用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

SuMeyYao/ysmpubmedclt

该数据集的许可证为apache-2.0,主要用于表格问答任务,数据集语言为英语,大小介于1亿到10亿之间。

hugging_face 收录

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

FSDD

FSDD(Free Spoken Digit Dataset)是一个开源的语音数据集,包含由不同说话者朗读的数字0到9的音频文件。该数据集旨在用于语音识别和机器学习算法的训练和测试。

github.com 收录

Coffee_Shop_Sales

该数据集包含了咖啡店的详细交易信息,包括交易ID、日期、时间、店铺编号、位置、产品类别、类型、名称、价格、月份、日期、星期和小时等属性。数据集用于分析咖啡店的销售情况,如收入和交易量的变化趋势。

github 收录