【我遇到的问题】 • 现象:该数据集的下载链接已失效 【相关信息】 • 可考虑访问这个链接获取类似文件~https://www.selectdataset.com/dataset/3688356173feccbcf1f1e490ddc6bc72
GEAL
收藏arXiv2024-12-13 更新2024-12-24 收录
下载链接:
https://huggingface.co/datasets/dylanorange/geal
下载链接
链接失效反馈官方服务:
资源简介:
GEAL数据集由新加坡国立大学创建,旨在评估3D对象上的可操作区域识别,特别是在机器人和人机交互中的应用。该数据集通过引入多种真实世界的损坏类型,如缩放、裁剪等,来测试3D可操作性模型的鲁棒性。数据集的创建过程结合了3D高斯喷射技术,将稀疏的3D点云数据转换为2D表示,以利用大规模预训练的2D模型的泛化能力。GEAL数据集主要用于解决3D可操作性学习中的泛化性和鲁棒性问题,特别是在面对数据噪声和损坏时的表现。
The GEAL dataset was developed by the National University of Singapore to evaluate actionable region recognition on 3D objects, with targeted applications in robotics and human-computer interaction. To test the robustness of 3D manipulability models, the dataset incorporates various real-world data corruptions such as scaling and cropping. The construction of this dataset adopts 3D Gaussian Splatting technology, which converts sparse 3D point cloud data into 2D representations to leverage the generalization capabilities of large-scale pre-trained 2D models. The GEAL dataset is primarily used to address the generalization and robustness issues in 3D manipulability learning, particularly regarding model performance when faced with data noise and corruption.
提供机构:
新加坡国立大学
创建时间:
2024-12-13
搜集汇总
数据集介绍

构建方式
GEAL数据集通过引入双分支架构,利用3D高斯喷射(3D Gaussian Splatting)技术,将稀疏的3D点云数据映射到2D表示,从而生成逼真的2D渲染图像。这种映射方式不仅保留了3D点云的几何和语义信息,还允许利用大规模预训练的2D基础模型进行跨模态对齐。此外,数据集还引入了粒度自适应融合模块和2D-3D一致性对齐模块,进一步增强了跨模态对齐和知识迁移能力。为了评估模型的鲁棒性,GEAL数据集还构建了两个基于真实世界数据损坏的基准:PIAD-C和LASO-C,涵盖了多种数据损坏类型,如缩放、旋转、抖动等。
特点
GEAL数据集的核心特点在于其双分支架构,能够有效结合2D和3D模态的优势。通过3D高斯喷射技术,数据集能够在稀疏的3D点云上生成逼真的2D渲染图像,从而利用2D模型的泛化能力提升3D任务的性能。此外,数据集还引入了粒度自适应融合模块,能够动态整合多层次的视觉和文本特征,适应不同尺度和粒度的任务需求。2D-3D一致性对齐模块则确保了跨模态特征在嵌入空间中的一致性,增强了模型的鲁棒性和泛化能力。
使用方法
GEAL数据集主要用于3D可操作性学习任务,特别是在机器人和人机交互领域。用户可以通过该数据集训练模型,使其能够根据语义提示识别3D对象上的可操作区域。数据集的双分支架构允许用户在训练过程中同时利用2D和3D模态的信息,提升模型的泛化能力。在实际应用中,用户可以利用训练好的模型对新的3D对象进行可操作性预测,特别是在面对数据损坏或噪声干扰时,模型仍能保持较高的预测精度。此外,数据集还提供了基于损坏数据的基准测试,用户可以通过这些基准评估模型在真实世界场景中的鲁棒性。
背景与挑战
背景概述
GEAL(Generalizable 3D Affordance Learning with Cross-Modal Consistency)数据集由新加坡国立大学的研究团队创建,旨在解决3D物体交互区域识别中的泛化性和鲁棒性问题。该数据集的核心研究问题是如何通过跨模态一致性来提升3D物体交互区域学习的泛化能力。GEAL数据集通过引入大规模预训练的2D模型,利用双分支架构和3D高斯喷射技术,将3D点云与2D表示进行一致性映射,从而增强3D交互区域预测的鲁棒性和适应性。该数据集的创建对机器人和人类-机器交互领域具有重要意义,尤其是在动作预测、物体操作和自主决策等应用中。
当前挑战
GEAL数据集在构建过程中面临的主要挑战包括:1)3D交互区域学习的泛化性问题,由于标注数据有限,现有的3D模型在面对新类别物体时表现不佳;2)3D模型对噪声和数据损坏的鲁棒性不足,尤其是在传感器误差、场景复杂性和处理伪影等现实场景中。此外,构建过程中还面临跨模态一致性映射的复杂性,如何有效地将2D模型的语义信息迁移到3D模型中,并确保两者在特征空间中的一致性,是该数据集面临的重要技术挑战。
常用场景
经典使用场景
GEAL数据集的经典使用场景在于通过跨模态一致性增强3D物体可操作区域的学习。该数据集通过双分支架构,利用3D高斯喷射技术将稀疏的3D点云数据映射到2D表示,从而生成逼真的2D渲染图像。这种2D-3D映射使得3D分支能够从大规模预训练的2D模型中受益,提升3D可操作区域预测的泛化能力和鲁棒性。
实际应用
GEAL数据集在机器人和人类-机器交互领域具有广泛的应用前景。例如,机器人可以通过识别物体的可操作区域(如把手或按钮)来智能地与环境互动,从而实现自主决策和物体操作。此外,该数据集还可用于增强现实和虚拟现实中的交互设计,帮助用户更直观地理解物体的功能和操作方式。
衍生相关工作
GEAL数据集的提出催生了一系列相关研究工作,特别是在3D可操作区域学习和跨模态对齐领域。例如,基于GEAL的框架,后续研究进一步探索了如何通过更高效的2D-3D映射和多模态融合来提升模型的泛化能力。此外,GEAL的鲁棒性评估基准也启发了其他研究者开发新的数据集和方法,以应对3D点云数据中的噪声和损坏问题。
以上内容由遇见数据集搜集并总结生成



