OmniSpatial
收藏arXiv2025-06-04 更新2025-11-28 收录
下载链接:
https://hf-mirror.com/datasets/qizekun/OmniSpatial
下载链接
链接失效反馈官方服务:
资源简介:
OmniSpatial是一个全面的视觉-语言模型(VLM)空间推理基准,涵盖了动态推理、复杂空间逻辑、空间交互和视角采取四个主要类别。该数据集包含来自互联网数据爬取和手动注释的超过1.5K的问题-答案对,旨在挑战和评估VLM的空间推理能力。
OmniSpatial is a comprehensive visual-language model (VLM) spatial reasoning benchmark encompassing four core categories: dynamic reasoning, complex spatial logic, spatial interaction, and perspective taking. This dataset contains over 1.5k question-answer pairs sourced from web data crawling and manual annotation, and is designed to challenge and evaluate the spatial reasoning capabilities of VLMs.
提供机构:
清华大学, 西安交通大学, 上海交通大学, Galbot, 北京大学, 上海期智研究院, 上海人工智能实验室
创建时间:
2025-06-04



