five

Mono3DRefer

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/zhanyang-nwpu/mono3dvg
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个提供精细描述和问答注释的3D定位数据集,用于评估开放词汇的3D定位性能。它是用于在现实世界中评估3D感知算法的数据集集合中的一部分。该数据集的主要任务是3D定位。

This dataset is a 3D localization dataset equipped with fine-grained descriptions and question-answering annotations, designed to evaluate open-vocabulary 3D localization performance. It is part of a dataset collection for evaluating 3D perception algorithms in real-world scenarios. The main task of this dataset is 3D localization.
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Mono3DRefer是首个用于单目图像中3D视觉定位任务的数据集,包含外观和几何信息的语言描述,旨在定位图像中对象的真实3D范围。数据集可从Google Drive下载,并支持Mono3DVG-TR这一基于Transformer的端到端网络。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作