OpenScan

arXiv2024-08-21 更新2024-08-22 收录

下载链接：

https://github.com/YoujunZhao/OpenScan

下载链接

链接失效反馈

官方服务：

资源简介：

OpenScan数据集由香港城市大学和华南理工大学创建，专注于广义开放词汇的3D场景理解，涵盖了八个代表性的语言方面，如功能、属性、材料等。该数据集基于ScanNet200构建，包含超过15万条属性注释，旨在评估模型对抽象对象属性的理解能力。创建过程中，结合了知识图谱和人工注释，确保数据质量。OpenScan的应用领域包括自动驾驶和机器人技术，旨在解决3D场景中对象属性的识别和理解问题。

The OpenScan dataset, developed by City University of Hong Kong and South China University of Technology, focuses on generalized open-vocabulary 3D scene understanding. It covers eight representative linguistic aspects, including function, attribute, material and others. Built upon the ScanNet200 dataset, OpenScan contains over 150,000 attribute annotations, aiming to evaluate models' ability to understand abstract object attributes. During its creation, knowledge graphs and manual annotations were combined to ensure data quality. The application fields of OpenScan include autonomous driving and robotics, with the goal of solving the problems of object attribute recognition and understanding in 3D scenes.

提供机构：

香港城市大学华南理工大学

创建时间：

2024-08-21

搜集汇总

数据集介绍

构建方式

OpenScan数据集的构建基于ScanNet200基准，该基准包含超过1,500个3D扫描的200个物体类别。为了实现GOV-3D任务，OpenScan利用了ScanNet基准中的物体注释。OpenScan为每个物体提供了属性注释，将ScanNet200中单一的物体类别扩展到了八个与物体相关的属性的语言方面，包括功能、属性、类型、方式、同义词、需求、元素和材料。数据集的构建过程涉及知识图谱的关联、手动注释、属性分类和查询生成等步骤。

特点

OpenScan数据集的特点在于其包含广泛的物体属性，涵盖了八个语言方面的属性，如功能、属性、类型、方式、同义词、需求、元素和材料。这使得数据集能够全面评估现有OV-3D模型在理解抽象物体属性方面的泛化能力。数据集提供了347个属性类别的153,644个属性注释，平均每个场景有101.55个属性，每个物体有3.15个属性。此外，OpenScan还采用了查询生成策略，专注于物体属性而不是物体身份，这使得现有OV-3D模型可以进行评估。

使用方法

OpenScan数据集的使用方法涉及将3D点云场景和文本查询作为输入，预测最匹配物体的3D掩码。数据集提供了全面的属性注释，允许研究人员从不同方面评估OV-3D模型的性能。数据集还包含查询生成策略，可以帮助模型更好地理解物体属性。此外，数据集还提供了详细的统计数据和实验结果，可以帮助研究人员了解现有OV-3D模型的局限性，并为未来研究提供方向。

背景与挑战

背景概述

OpenScan数据集是由香港城市大学和华南理工大学的研究团队于2024年提出的，旨在解决3D场景理解中开放词汇问题的局限性。该数据集扩展了传统的3D场景理解任务，提出了广义开放词汇3D场景理解（GOV-3D）任务，旨在探索3D场景理解中的开放词汇问题。OpenScan数据集包含3D物体属性，跨越八个代表性的语言方面，包括功能、属性、材料等。该数据集的创建旨在全面评估模型对3D场景的理解程度，以及模型对抽象词汇的掌握能力。

当前挑战

OpenScan数据集面临的挑战包括：1) 对象属性识别的挑战，现有的OV-3D方法在理解抽象词汇方面存在困难，如功能、属性等；2) 构建过程中的挑战，如如何有效地将对象属性与3D场景关联起来，以及如何生成合适的文本查询等。

常用场景

经典使用场景

OpenScan数据集被广泛应用于广义开放词汇3D场景理解（GOV-3D）任务中。GOV-3D任务旨在评估模型对3D场景中抽象词汇的理解程度，而不仅仅是识别封闭的对象类别。OpenScan数据集包含了3D对象属性，涵盖八个代表语言方面的属性，包括功能、属性、材料等。这使得OpenScan成为一个用于评估OV-3D模型在理解抽象对象属性方面的泛化能力的理想基准。

实际应用

OpenScan数据集在实际应用中具有广泛的应用前景。例如，在自动驾驶领域，OpenScan可以帮助车辆识别和理解场景中的对象属性，从而更好地理解周围环境并做出更安全的决策。在机器人领域，OpenScan可以帮助机器人更好地理解其操作环境中的对象属性，从而更好地执行任务。此外，OpenScan数据集还可以用于室内场景理解、三维物体识别等任务，为相关领域的研究和应用提供了重要的数据支持。

衍生相关工作

OpenScan数据集的引入推动了广义开放词汇3D场景理解（GOV-3D）任务的研究。在此基础上，研究者们可以进一步探索OV-3D模型在理解抽象对象属性方面的泛化能力，并提出更有效的改进方法。此外，OpenScan数据集还可以用于开发新的3D场景理解算法，并评估其在不同任务中的性能。OpenScan数据集的引入为相关领域的研究和应用提供了新的思路和方向，有望推动该领域的发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集