ScanNet v2
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/ScanNet_v2
下载链接
链接失效反馈官方服务:
资源简介:
ScanNet 是一个 RGB-D 视频数据集,包含 1500 多次扫描中的 250 万个视图,并使用 3D 相机姿势、表面重建和实例级语义分割进行注释。为了收集这些数据,我们设计了一个易于使用且可扩展的 RGB-D 捕获系统,其中包括自动表面重建和众包语义注释。我们表明,使用这些数据有助于在几个 3D 场景理解任务上实现最先进的性能,包括 3D 对象分类、语义体素标记和 CAD 模型检索。
ScanNet is an RGB-D video dataset consisting of 2.5 million views across more than 1500 scans, annotated with 3D camera poses, surface reconstruction outputs, and instance-level semantic segmentation. To curate this dataset, we developed an easy-to-use and scalable RGB-D capture system that integrates automatic surface reconstruction and crowdsourced semantic annotation. We demonstrate that utilizing this dataset enables state-of-the-art performance on a range of 3D scene understanding tasks, including 3D object classification, semantic voxel labeling, and CAD model retrieval.
提供机构:
OpenDataLab
创建时间:
2022-04-28
搜集汇总
数据集介绍

背景与挑战
背景概述
ScanNet v2是一个大规模的RGB-D视频数据集,包含超过1500次扫描和250万个视图,提供了3D相机姿势、表面重建和实例级语义分割的丰富注释。该数据集设计用于支持3D场景理解任务,如物体分类和语义分割,并通过自动化和众包方式高效收集数据,由多所知名大学联合发布,是计算机视觉领域的经典基准数据集。
以上内容由遇见数据集搜集并总结生成



