Mono3DRefer
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/zhanyang-nwpu/mono3dvg
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个提供精细描述和问答注释的3D定位数据集,用于评估开放词汇的3D定位性能。它是用于在现实世界中评估3D感知算法的数据集集合中的一部分。该数据集的主要任务是3D定位。
This dataset is a 3D localization dataset equipped with fine-grained descriptions and question-answering annotations, designed to evaluate open-vocabulary 3D localization performance. It is part of a dataset collection for evaluating 3D perception algorithms in real-world scenarios. The main task of this dataset is 3D localization.
搜集汇总
数据集介绍

背景与挑战
背景概述
Mono3DRefer是首个用于单目图像中3D视觉定位任务的数据集,包含外观和几何信息的语言描述,旨在定位图像中对象的真实3D范围。数据集可从Google Drive下载,并支持Mono3DVG-TR这一基于Transformer的端到端网络。
以上内容由遇见数据集搜集并总结生成



