OpenScan

arXiv2024-08-21 更新2024-08-22 收录

下载链接：

https://github.com/YoujunZhao/OpenScan

下载链接

链接失效反馈

官方服务：

资源简介：

OpenScan数据集由香港城市大学和华南理工大学创建，专注于广义开放词汇的3D场景理解，涵盖了八个代表性的语言方面，如功能、属性、材料等。该数据集基于ScanNet200构建，包含超过15万条属性注释，旨在评估模型对抽象对象属性的理解能力。创建过程中，结合了知识图谱和人工注释，确保数据质量。OpenScan的应用领域包括自动驾驶和机器人技术，旨在解决3D场景中对象属性的识别和理解问题。

提供机构：

香港城市大学华南理工大学

创建时间：

2024-08-21

搜集汇总

数据集介绍

构建方式

OpenScan数据集的构建基于ScanNet200基准，该基准包含超过1,500个3D扫描的200个物体类别。为了实现GOV-3D任务，OpenScan利用了ScanNet基准中的物体注释。OpenScan为每个物体提供了属性注释，将ScanNet200中单一的物体类别扩展到了八个与物体相关的属性的语言方面，包括功能、属性、类型、方式、同义词、需求、元素和材料。数据集的构建过程涉及知识图谱的关联、手动注释、属性分类和查询生成等步骤。

特点

OpenScan数据集的特点在于其包含广泛的物体属性，涵盖了八个语言方面的属性，如功能、属性、类型、方式、同义词、需求、元素和材料。这使得数据集能够全面评估现有OV-3D模型在理解抽象物体属性方面的泛化能力。数据集提供了347个属性类别的153,644个属性注释，平均每个场景有101.55个属性，每个物体有3.15个属性。此外，OpenScan还采用了查询生成策略，专注于物体属性而不是物体身份，这使得现有OV-3D模型可以进行评估。

使用方法

OpenScan数据集的使用方法涉及将3D点云场景和文本查询作为输入，预测最匹配物体的3D掩码。数据集提供了全面的属性注释，允许研究人员从不同方面评估OV-3D模型的性能。数据集还包含查询生成策略，可以帮助模型更好地理解物体属性。此外，数据集还提供了详细的统计数据和实验结果，可以帮助研究人员了解现有OV-3D模型的局限性，并为未来研究提供方向。

背景与挑战

背景概述

OpenScan数据集是由香港城市大学和华南理工大学的研究团队于2024年提出的，旨在解决3D场景理解中开放词汇问题的局限性。该数据集扩展了传统的3D场景理解任务，提出了广义开放词汇3D场景理解（GOV-3D）任务，旨在探索3D场景理解中的开放词汇问题。OpenScan数据集包含3D物体属性，跨越八个代表性的语言方面，包括功能、属性、材料等。该数据集的创建旨在全面评估模型对3D场景的理解程度，以及模型对抽象词汇的掌握能力。

当前挑战

OpenScan数据集面临的挑战包括：1) 对象属性识别的挑战，现有的OV-3D方法在理解抽象词汇方面存在困难，如功能、属性等；2) 构建过程中的挑战，如如何有效地将对象属性与3D场景关联起来，以及如何生成合适的文本查询等。

常用场景

经典使用场景

OpenScan数据集被广泛应用于广义开放词汇3D场景理解（GOV-3D）任务中。GOV-3D任务旨在评估模型对3D场景中抽象词汇的理解程度，而不仅仅是识别封闭的对象类别。OpenScan数据集包含了3D对象属性，涵盖八个代表语言方面的属性，包括功能、属性、材料等。这使得OpenScan成为一个用于评估OV-3D模型在理解抽象对象属性方面的泛化能力的理想基准。

实际应用

OpenScan数据集在实际应用中具有广泛的应用前景。例如，在自动驾驶领域，OpenScan可以帮助车辆识别和理解场景中的对象属性，从而更好地理解周围环境并做出更安全的决策。在机器人领域，OpenScan可以帮助机器人更好地理解其操作环境中的对象属性，从而更好地执行任务。此外，OpenScan数据集还可以用于室内场景理解、三维物体识别等任务，为相关领域的研究和应用提供了重要的数据支持。

衍生相关工作

OpenScan数据集的引入推动了广义开放词汇3D场景理解（GOV-3D）任务的研究。在此基础上，研究者们可以进一步探索OV-3D模型在理解抽象对象属性方面的泛化能力，并提出更有效的改进方法。此外，OpenScan数据集还可以用于开发新的3D场景理解算法，并评估其在不同任务中的性能。OpenScan数据集的引入为相关领域的研究和应用提供了新的思路和方向，有望推动该领域的发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集