MindCube|多模态AI数据集|空间推理数据集
收藏MindCube数据集概述
数据集基本信息
- 名称: MindCube: Spatial Mental Modeling from Limited Views
- 类型: 空间推理多模态数据集
- 开发团队: 西北大学、斯坦福大学、纽约大学、华盛顿大学联合开发
- 许可证: MIT License
- 数据格式: JSONL文件
- 主页: https://mind-cube.github.io/
- HuggingFace数据集地址: https://huggingface.co/datasets/MLL-Lab/MindCube
- 模型检查点: https://huggingface.co/MLL-Lab/models
数据集内容
- 原始数据文件:
- MindCube_train.jsonl
- MindCube_tinybench.jsonl
- 处理后的数据:
- 认知地图(Cogmap)
- 推理链(Reasoning chains)
- 8种任务变体的提示词
数据处理流程
-
原始数据处理
- 输入: JSONL格式的原始问答对
- 输出: 结构化认知地图和推理链
-
提示词生成
- 支持8种不同任务类型的提示词生成
-
模型格式转换
- 当前支持Qwen2.5VL格式
评估指标
- 提供批量评估和单独评估两种方式
- 输出详细的性能指标JSON文件
相关资源
- 代码库: https://github.com/mll-lab-nu/MindCube
- 修改版Qwen2.5-VL: https://github.com/QinengWang-Aiden/Qwen2.5-VL-MindCube

ShapeNet
ShapeNet 是由斯坦福大学、普林斯顿大学和美国芝加哥丰田技术研究所的研究人员开发的大型 3D CAD 模型存储库。该存储库包含超过 3 亿个模型,其中 220,000 个模型被分类为使用 WordNet 上位词-下位词关系排列的 3,135 个类。 ShapeNet Parts 子集包含 31,693 个网格,分为 16 个常见对象类(即桌子、椅子、平面等)。每个形状基本事实包含 2-5 个部分(总共 50 个部分类)。
OpenDataLab 收录
Global Flood Database (GFD)
全球洪水数据库(GFD)是一个包含全球范围内洪水事件记录的数据集。该数据集提供了详细的洪水事件信息,包括洪水发生的时间、地点、影响范围、受灾人口和财产损失等。数据集的目的是为了支持洪水风险评估、灾害管理和气候变化研究。
global-flood-database.cloudtostreet.info 收录
全国兴趣点(POI)数据
POI(Point of Interest),即兴趣点,一个POI可以是餐厅、超市、景点、酒店、车站、停车场等。兴趣点通常包含四方面信息,分别为名称、类别、坐标、分类。其中,分类一般有一级分类和二级分类,每个分类都有相应的行业的代码和名称一一对应。 POI包含的信息及其衍生信息主要包含三个部分:
CnOpenData 收录
SHHS Sleep Heart Health Study Dataset
SHHS(Sleep Heart Health Study)数据集是一个大型多中心研究项目,旨在研究睡眠障碍与心血管疾病之间的关系。数据集包括了参与者的睡眠记录、心血管健康指标、生活习惯、遗传信息等多方面的数据。
sleepdata.org 收录
《1981—2010年中国主要农作物生育期图集》
开展了2001—2010年全国县域单元的主要农作物(春小麦,冬小麦,一季稻,双击早稻、双季晚稻、春玉米,夏玉米,棉花,春大豆,夏大豆)各生育期开始日期和结束日期的调研工作,结合全国农业气象站点的物候资料,绘制了《中国主要农作物生育期图集》。图中所表达的要素和指标均经过了专家鉴定,并考虑了它的农业意义和主要农作物对气象条件的要求,共绘制145幅图。
国家地球系统科学数据中心 收录