MindCube

github2025-06-26 更新2025-06-27 收录

下载链接：

https://github.com/mll-lab-nu/MindCube

下载链接

链接失效反馈

官方服务：

资源简介：

MindCube是一个模块化框架，用于生成和评估多模态AI模型的空间推理数据集。该项目遵循从原始数据到模型评估的完整流程，包含专门用于支架数据整理、提示生成、模型推理、训练和全面评估的模块。

MindCube is a modular framework for generating and evaluating spatial reasoning datasets for multimodal AI models. This project follows a complete end-to-end pipeline from raw data to model evaluation, incorporating modules dedicated to supporting data curation, prompt generation, model inference, training, and comprehensive evaluation.

创建时间：

2025-06-21

原始信息汇总

MindCube数据集概述

数据集基本信息

名称: MindCube: Spatial Mental Modeling from Limited Views
类型: 空间推理多模态数据集
开发团队: 西北大学、斯坦福大学、纽约大学、华盛顿大学联合开发
许可证: MIT License
数据格式: JSONL文件
主页: https://mind-cube.github.io/
HuggingFace数据集地址: https://huggingface.co/datasets/MLL-Lab/MindCube
模型检查点: https://huggingface.co/MLL-Lab/models

数据集内容

原始数据文件:
- MindCube_train.jsonl
- MindCube_tinybench.jsonl
处理后的数据:
- 认知地图(Cogmap)
- 推理链(Reasoning chains)
- 8种任务变体的提示词

数据处理流程

原始数据处理
- 输入: JSONL格式的原始问答对
- 输出: 结构化认知地图和推理链
提示词生成
- 支持8种不同任务类型的提示词生成
模型格式转换
- 当前支持Qwen2.5VL格式

评估指标

提供批量评估和单独评估两种方式
输出详细的性能指标JSON文件

相关资源

代码库: https://github.com/mll-lab-nu/MindCube
修改版Qwen2.5-VL: https://github.com/QinengWang-Aiden/Qwen2.5-VL-MindCube

搜集汇总

数据集介绍

构建方式

MindCube数据集通过模块化框架构建，专注于空间推理任务的多模态AI模型训练与评估。其构建流程从原始数据出发，经过结构化处理生成认知地图与推理链，随后转化为多种任务类型的提示模板，最终适配不同模型格式。该过程采用分阶段处理策略，包括原始数据清洗、认知支架生成、多样化提示构建等关键步骤，确保数据质量与任务多样性。

特点

MindCube数据集的核心特点体现在其系统化的空间推理任务设计上。该数据集包含8种不同任务变体，覆盖从基础问答到复杂空间关系推理的多层次需求。数据集特别强调有限视角下的空间心理建模能力，通过认知地图和增强推理链等创新结构，为模型提供丰富的空间关系表征。其模块化设计支持Qwen2.5VL等多种主流视觉语言模型的直接适配，且包含完整的评估指标体系。

使用方法

使用MindCube数据集需遵循其模块化工作流程。首先配置包含PyTorch和Flash-Attention的专用环境，通过脚本下载预处理数据。用户可选择批量生成评估数据或分步执行支架构建、提示生成等操作。模型训练支持完整监督微调流程，包含硬件配置调整、Qwen仓库集成及定制化训练参数设置。评估阶段提供批量与单任务两种模式，输出包含标准性能指标的结构化结果。整个流程通过标准化脚本实现操作自动化。

背景与挑战

背景概述

MindCube是由西北大学、斯坦福大学、纽约大学和华盛顿大学的研究团队联合开发的多模态空间推理数据集与框架，旨在解决人工智能在有限视角下进行空间心理建模的核心问题。该数据集通过结构化处理原始空间推理数据，生成认知地图和推理链，为模型提供空间理解的脚手架。研究团队采用模块化设计，涵盖数据生成、提示构建、模型训练与评估全流程，显著推动了多模态模型在空间认知领域的发展。项目创建于2025年，汇聚了计算机视觉与认知科学领域的顶尖学者，其创新性的评估体系为衡量AI系统的空间推理能力建立了新标准。

当前挑战

MindCube面临的挑战主要体现在两个方面：在领域问题层面，如何准确建模人类从有限视觉输入中构建三维空间认知的能力仍存在显著差距，现有模型在复杂空间关系推理任务中的表现远低于人类水平；在构建过程层面，数据采集需平衡场景多样性与标注一致性，认知地图的自动生成面临语义鸿沟问题，而多任务提示设计需确保不同变体间的可比性。此外，评估指标的设计需兼顾自动化程度与认知科学性，这对跨学科协作提出了较高要求。

常用场景

经典使用场景

MindCube数据集在空间认知建模领域具有重要价值，其经典使用场景主要集中于多模态人工智能模型的训练与评估。该数据集通过提供结构化空间推理问题和图像，支持模型从有限视角构建完整空间心理表征。研究人员可利用其模块化框架，开展从原始数据处理到模型性能评估的完整实验流程，特别适合研究视觉语言模型在三维空间理解方面的能力边界。

解决学术问题

该数据集有效解决了空间认知计算中的关键学术难题。通过精心设计的认知地图和推理链标注，突破了传统方法在有限视角空间推理上的局限性。其包含的8种任务变体和多格式提示，为研究多模态模型的空间表征学习机制提供了标准化测试平台，显著推进了机器空间智能领域的可解释性研究。

衍生相关工作

该数据集已催生系列创新研究，包括基于Qwen2.5VL架构的空间推理专用模型开发，以及结合强化学习的混合训练范式探索。相关衍生工作显著提升了模型在视觉问答、场景重构等任务中的表现，其中多项成果已被计算机视觉顶会收录，形成了空间认知计算的新研究方向。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集