OpenScan
收藏arXiv2024-08-21 更新2024-08-22 收录
下载链接:
https://github.com/YoujunZhao/OpenScan
下载链接
链接失效反馈官方服务:
资源简介:
OpenScan数据集由香港城市大学和华南理工大学创建,专注于广义开放词汇的3D场景理解,涵盖了八个代表性的语言方面,如功能、属性、材料等。该数据集基于ScanNet200构建,包含超过15万条属性注释,旨在评估模型对抽象对象属性的理解能力。创建过程中,结合了知识图谱和人工注释,确保数据质量。OpenScan的应用领域包括自动驾驶和机器人技术,旨在解决3D场景中对象属性的识别和理解问题。
提供机构:
香港城市大学 华南理工大学
创建时间:
2024-08-21
搜集汇总
数据集介绍

构建方式
OpenScan数据集的构建基于ScanNet200基准,该基准包含超过1,500个3D扫描的200个物体类别。为了实现GOV-3D任务,OpenScan利用了ScanNet基准中的物体注释。OpenScan为每个物体提供了属性注释,将ScanNet200中单一的物体类别扩展到了八个与物体相关的属性的语言方面,包括功能、属性、类型、方式、同义词、需求、元素和材料。数据集的构建过程涉及知识图谱的关联、手动注释、属性分类和查询生成等步骤。
特点
OpenScan数据集的特点在于其包含广泛的物体属性,涵盖了八个语言方面的属性,如功能、属性、类型、方式、同义词、需求、元素和材料。这使得数据集能够全面评估现有OV-3D模型在理解抽象物体属性方面的泛化能力。数据集提供了347个属性类别的153,644个属性注释,平均每个场景有101.55个属性,每个物体有3.15个属性。此外,OpenScan还采用了查询生成策略,专注于物体属性而不是物体身份,这使得现有OV-3D模型可以进行评估。
使用方法
OpenScan数据集的使用方法涉及将3D点云场景和文本查询作为输入,预测最匹配物体的3D掩码。数据集提供了全面的属性注释,允许研究人员从不同方面评估OV-3D模型的性能。数据集还包含查询生成策略,可以帮助模型更好地理解物体属性。此外,数据集还提供了详细的统计数据和实验结果,可以帮助研究人员了解现有OV-3D模型的局限性,并为未来研究提供方向。
背景与挑战
背景概述
OpenScan数据集是由香港城市大学和华南理工大学的研究团队于2024年提出的,旨在解决3D场景理解中开放词汇问题的局限性。该数据集扩展了传统的3D场景理解任务,提出了广义开放词汇3D场景理解(GOV-3D)任务,旨在探索3D场景理解中的开放词汇问题。OpenScan数据集包含3D物体属性,跨越八个代表性的语言方面,包括功能、属性、材料等。该数据集的创建旨在全面评估模型对3D场景的理解程度,以及模型对抽象词汇的掌握能力。
当前挑战
OpenScan数据集面临的挑战包括:1) 对象属性识别的挑战,现有的OV-3D方法在理解抽象词汇方面存在困难,如功能、属性等;2) 构建过程中的挑战,如如何有效地将对象属性与3D场景关联起来,以及如何生成合适的文本查询等。
常用场景
经典使用场景
OpenScan数据集被广泛应用于广义开放词汇3D场景理解(GOV-3D)任务中。GOV-3D任务旨在评估模型对3D场景中抽象词汇的理解程度,而不仅仅是识别封闭的对象类别。OpenScan数据集包含了3D对象属性,涵盖八个代表语言方面的属性,包括功能、属性、材料等。这使得OpenScan成为一个用于评估OV-3D模型在理解抽象对象属性方面的泛化能力的理想基准。
实际应用
OpenScan数据集在实际应用中具有广泛的应用前景。例如,在自动驾驶领域,OpenScan可以帮助车辆识别和理解场景中的对象属性,从而更好地理解周围环境并做出更安全的决策。在机器人领域,OpenScan可以帮助机器人更好地理解其操作环境中的对象属性,从而更好地执行任务。此外,OpenScan数据集还可以用于室内场景理解、三维物体识别等任务,为相关领域的研究和应用提供了重要的数据支持。
衍生相关工作
OpenScan数据集的引入推动了广义开放词汇3D场景理解(GOV-3D)任务的研究。在此基础上,研究者们可以进一步探索OV-3D模型在理解抽象对象属性方面的泛化能力,并提出更有效的改进方法。此外,OpenScan数据集还可以用于开发新的3D场景理解算法,并评估其在不同任务中的性能。OpenScan数据集的引入为相关领域的研究和应用提供了新的思路和方向,有望推动该领域的发展。
以上内容由遇见数据集搜集并总结生成



