OmniNOCS
收藏OmniNOCS 数据集概述
数据集简介
OmniNOCS 是一个大规模的 NOCS 数据集,包含来自不同领域的数据:户外场景、室内场景和以物体为中心的视频。该数据集包含独立的帧,其中物体的标注包括标准 3D 方向、实例掩码和 3D NOCS 坐标。OmniNOCS 提供了以下数据源的标注:[KITTI], [Virtual-KITTI], [nuScenes], [Waymo-OD], [Cityscapes], [Hypersim], [Objectron], [ARKitScenes], 和 [NOCS-Real275]。
数据格式
每个帧提供实例分割、NOCS 坐标和 3D 边界框,格式如下:
-
实例分割:实例图存储在
<path_to_frame>_instances.png,为 16 位单通道 PNG 图像。每个有效掩码的对象在其掩码中的每个像素处具有实例 ID。实例 ID 在该特定帧中是唯一的。没有有效对象索引的区域可以是背景(包含 0)或未知(包含 65535)。未知区域不应用于监督/评估。 -
NOCS 坐标:NOCS 图存储在
<path_to_frame>_nocs.png,为 16 位 4 通道 PNG 图像。前 3 个通道表示 X,Y,Z NOCS 值。最后一个通道是一个二进制掩码,表示像素位置是否包含有效的 NOCS 坐标。请注意,某些领域(特别是户外数据集如 KITTI)的 NOCS 标注是稀疏的,因此对象实例掩码内的所有像素不一定具有有效的 NOCS 坐标。 -
3D 边界框:每个对象的 3D 边界框在 JSON 元数据文件中提供(如下所述)。
每个 OmniNOCS <source>-<split> 组合(例如 KITTI-train)都有自己的 JSON 元数据文件。每个 JSON 包含一个每帧元数据的列表,列表长度等于该组合中的帧数。每帧元数据结构如下:
json { "objects": [ { "rotation": 3x3 标准方向(对象到相机变换), "translation": 3x1 3D 平移(以米为单位)(在相机坐标中), "size": 3x1 3D 尺寸(以米为单位), "object_id": 实例分割图中使用的实例 ID, "category": 对象类别的名称,字符串形式 } ], "image_name": 该帧在原始数据集中的图像路径, "omninocs_name": 该帧在 OmniNOCS 中的 NOCS 和实例图像路径, "nocs_image_downscale": NOCS 图像缩小比例(图像分辨率 / NOCS 图分辨率),用于 NOCS 图像小于彩色图像的情况, "intrinsics": { "fx": 焦距(x)以像素为单位, "fy": 焦距(y)以像素为单位, "cx": 主点(x)以像素为单位, "cy": 主点(y)以像素为单位 } }
坐标约定
我们使用右手坐标系来表示对象和相机。
-
对象坐标系:OmniNOCS 对象具有按类别标准化的帧。这意味着类别中所有对象的 X, Y 和 Z 轴一致定向。例如,汽车的 +X 轴向前,+Y 轴向左,+Z 轴向上。当对象在场景中直立放置时,其 +Z 轴指向重力反方向。某些具有对称性的类别(如瓶子或碗)具有绕轴的旋转对称性,使得标准方向不明确。我们还注意到,由于遮挡或标注错误,某些对象的方向可能不是标准的。请报告任何此类情况,以便可以删除或更正。
-
相机坐标系:我们的相机约定使用 +X 轴向右,+Y 轴向下,+Z 轴从相机向外。我们的元数据文件仅包含相机内参(无外参),因为对象姿态已经相对于相机帧提供。
下载
OmniNOCS 为其他数据集的图像提供 NOCS 标注。请参考 SETUP.md 获取下载所有数据和设置 OmniNOCS 的说明。
使用
我们提供了一个 colab 笔记本,下载训练集的一小部分并可视化 OmniNOCS 的 NOCS 和边界框标注,以展示数据的使用方法。
引用
latex @article{omninocs2024, title={OmniNOCS: A unified NOCS dataset and model for 3D lifting of 2D objects}, author={Akshay Krishnan and Abhijit Kundu and Kevis-Kokitsi Maninis and James Hays and Matthew Brown}, year={2024}, }
许可和免责声明
所有软件均根据 Apache License, Version 2.0 (Apache 2.0) 许可;您不得使用此文件,除非符合 Apache 2.0 许可。您可以从以下网址获取 Apache 2.0 许可的副本:https://www.apache.org/licenses/LICENSE-2.0
我们的数据集为以下数据集的图像添加了标注,这些数据集的许可如下:
| 数据集 | 许可 |
|---|---|
| KITTI | CC BY-NC-SA 3.0 DEED |
| ARKitScenes | CC BY-NC-SA 4.0 DEED |
| Virtual KITTI | CC BY-NC-SA 3.0 LEGAL CODE |
| nuScenes | CC BY-NC-SA 4.0 |
| Hypersim | CC BY-NC-SA 3.0 DEED |
| NOCS-Real275 | MIT |
| Waymo OD | Apache 2.0 (See Waymo terms) |
| Objectron | Microsoft C-UDA |
| Cityscapes 3D | CC-BY 4.0 |
所有其他材料均根据 Creative Commons Attribution 4.0 International License (CC-BY) 许可。您可以从以下网址获取 CC-BY 许可的副本:https://creativecommons.org/licenses/by/4.0/legalcode
除非适用法律要求或书面同意,否则根据 Apache 2.0 或 CC-BY 许可分发的所有软件和材料均按“原样”分发,不提供任何明示或暗示的担保或条件。请参阅许可协议以了解特定语言下的权限和限制。
这不是 Google 的官方产品。




