COLE-Ricoh/ToF-360|室内场景理解数据集|RGB-D图像数据集
收藏ToF-360 数据集
概述
ToF-360 数据集包含具有实例级语义和房间布局注释的球形 RGB-D 图像,涵盖 4 个独特的场景。该数据集包含 179 张等距柱状 RGB 图像及其对应的深度、表面法线、XYZ 图像和 HHA 图像,标记了建筑定义对象类别和基于图像的布局边界(天花板-墙、墙-地板)。该数据集支持基于单次重建的场景理解任务,无需室内空间的全局对齐。
数据集模态
每个场景在数据集中都有自己的文件夹。每个区域的模态都包含在该文件夹中,格式为 <场景>/<模态>
。
RGB 图像:
RGB 图像包含等距柱状的 24 位彩色图像,由传感器拍摄的原始双鱼眼图像转换而来。
曼哈顿对齐的 RGB 图像:
我们遵循 [LGT-Net] 提出的预处理代码创建曼哈顿对齐的 RGB 图像。数据集的示例代码位于 assets/preprocessing/align_manhattan.py
。
深度图像:
深度图像存储为 16 位灰度 PNG 图像,最大深度为 128 米,灵敏度为 1/512 米。缺失值用 0 表示。注意,深度定义为从相机点中心到全景图中的点的距离。
XYZ 图像:
XYZ 图像保存为 NumPy 的 .npy
二进制文件格式,包含空间中像素对齐的数据点集,灵敏度为毫米。其大小必须为 (高度, 宽度, 3[xyz])。
法线图像:
法线是每通道表面法线图像,以 127.5 为中心。法线向量保存为 24 位 RGB PNG 图像,其中红色表示水平值(越红向右),绿色表示垂直值(越绿向下),蓝色表示朝向相机。法线是通过 Open3D 中的 法线估计函数 计算的。从 3D 创建法线图像的工具位于 assets/preprocessing/depth2normal.py
。
HHA 图像:
HHA 图像包含水平视差、离地高度和与重力角度的信息。我们遵循 Depth2HHA-python 创建它。代码位于 assets/preprocessing/getHHA.py
。
注释:
我们使用 COCO Annotator 对 RGB 数据进行标注。我们遵循为 RGB-D 和点云数据开发的 基于本体的注释指南。<场景>/注释
包含 json 格式的文件,<场景>/语义
和 <场景>/实例
包含保存为 .npy
二进制文件的图像类标注数据。
房间布局注释:
房间布局注释以与 PanoAnnotator 相同的 json 格式存储。有关更多详细信息,请参阅该仓库。
中国1km分辨率逐月降水量数据集(1901-2023)
该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。
国家青藏高原科学数据中心 收录
SuMeyYao/ysmpubmedclt
该数据集的许可证为apache-2.0,主要用于表格问答任务,数据集语言为英语,大小介于1亿到10亿之间。
hugging_face 收录
LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
FSDD
FSDD(Free Spoken Digit Dataset)是一个开源的语音数据集,包含由不同说话者朗读的数字0到9的音频文件。该数据集旨在用于语音识别和机器学习算法的训练和测试。
github.com 收录
Coffee_Shop_Sales
该数据集包含了咖啡店的详细交易信息,包括交易ID、日期、时间、店铺编号、位置、产品类别、类型、名称、价格、月份、日期、星期和小时等属性。数据集用于分析咖啡店的销售情况,如收入和交易量的变化趋势。
github 收录