five

OmniSpatial

收藏
arXiv2025-06-04 更新2025-11-28 收录
下载链接:
https://hf-mirror.com/datasets/qizekun/OmniSpatial
下载链接
链接失效反馈
官方服务:
资源简介:
OmniSpatial是一个全面的视觉-语言模型(VLM)空间推理基准,涵盖了动态推理、复杂空间逻辑、空间交互和视角采取四个主要类别。该数据集包含来自互联网数据爬取和手动注释的超过1.5K的问题-答案对,旨在挑战和评估VLM的空间推理能力。

OmniSpatial is a comprehensive visual-language model (VLM) spatial reasoning benchmark encompassing four core categories: dynamic reasoning, complex spatial logic, spatial interaction, and perspective taking. This dataset contains over 1.5k question-answer pairs sourced from web data crawling and manual annotation, and is designed to challenge and evaluate the spatial reasoning capabilities of VLMs.
提供机构:
清华大学, 西安交通大学, 上海交通大学, Galbot, 北京大学, 上海期智研究院, 上海人工智能实验室
创建时间:
2025-06-04
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作