MMMU/MMMU

Name: MMMU/MMMU
Creator: MMMU
Published: 2026-04-21 18:36:31
License: 暂无描述

Hugging Face2026-04-21 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/MMMU/MMMU

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个多学科的问答任务集合，涵盖了会计、农业、建筑与工程等多个领域。每个配置包含id、问题、选项、解释、多个图像以及主题难度、问题类型和子领域等元数据字段。数据集分为开发集、验证集和测试集，每个集的大小和示例数量都有详细说明。

This dataset is a multi-disciplinary collection of question-answering tasks, covering fields such as Accounting, Agriculture, Architecture_and_Engineering, and more. Each configuration includes features like id, question, options, explanation, multiple images, and various metadata fields like topic_difficulty, question_type, and subfield. The dataset is divided into dev, validation, and test sets, with detailed byte sizes and example counts provided for each split.

提供机构：

MMMU

原始信息汇总

数据集概述

基本信息

语言: 英语
许可证: Apache-2.0
大小分类: 10K<n<100K
任务分类:
- 问答
- 视觉问答
- 多选题
美观名称: mmmu

数据集结构

数据集包含多个配置，每个配置对应不同的领域，每个领域包含以下特征：

id: 字符串类型
question: 字符串类型
options: 字符串类型
explanation: 字符串类型
image_1 至 image_7: 图像类型
img_type: 字符串类型
answer: 字符串类型
topic_difficulty: 字符串类型
question_type: 字符串类型
subfield: 字符串类型

数据集分割

每个配置包含三个分割：

dev: 开发集
validation: 验证集
test: 测试集

每个分割包含以下信息：

num_bytes: 字节数
num_examples: 示例数

数据集大小

每个配置的下载大小和数据集大小不同，具体数值如下：

配置名称	下载大小	数据集大小
Accounting	37363379	23996509.0
Agriculture	1158036990	1134964291.0
Architecture_and_Engineering	48763955	16913735.0
Art	585798641	273977108.0
Art_Theory	930525695	594091311.0
Basic_Medical_Science	84666454	53066131.0
Biology	410242502	142032356.0
Chemistry	108345562	39000499.0
Clinical_Medicine	160611488	110552292.0
Computer_Science	55640991	34559922.0
Design	142866617	97859324.0
Diagnostics_and_Laboratory_Medicine	603957093	196165419.0
Economics	20777635	13510782.0
Electronics	11602832	6482695.0
Energy_and_Power	35246567	16495369.0
Finance	29551521	13432987.0
Geography	374766631	145383776.0
History	232549641	125492903.0
Literature	132145895	66993788.0
Manage	51186888	33690913.0
Marketing	13146078	9322917.0
Materials	78365794	27801697.0
Math	-	-

以上信息总结了数据集的基本属性、结构、分割以及大小，为使用者提供了全面的数据集概览。

搜集汇总

数据集介绍

构建方式

在跨学科知识评估领域，MMMU数据集的构建体现了对专业深度与广度的双重追求。该数据集通过系统性地收集来自30个不同学科领域的专业考试题目，涵盖会计学、农业、艺术理论乃至基础医学等广泛主题。每个条目均包含多模态元素，整合了文本问题、多项选择选项以及最多七张相关图像，并辅以详细的解释说明。构建过程中，团队精心标注了题目难度、问题类型及所属子领域，确保数据在学科覆盖与认知层次上的均衡分布，为评估模型的多领域知识理解能力奠定了坚实基础。

使用方法

对于致力于多模态大模型评估的研究者而言，MMMU数据集提供了标准化的测试框架。用户可通过HuggingFace平台便捷加载数据集，并依据具体学科配置选择相应子集进行探索。数据集已预先划分为开发集、验证集和测试集，便于进行模型训练、超参数调优与最终性能评测。在实际应用中，研究者可结合问题文本、关联图像及选项信息，驱动模型生成预测答案，并利用提供的标准答案与解释进行验证与误差分析，从而系统评估模型在跨学科多模态理解任务上的综合表现。

背景与挑战

背景概述

在人工智能迈向通用智能的演进历程中，多模态理解能力成为衡量模型认知深度的关键标尺。MMMU数据集由研究团队于2023年构建，旨在应对跨学科知识融合与视觉语言联合推理的核心研究问题。该数据集涵盖艺术、医学、工程等三十余个学科，通过融合文本问题与多样化的图像信息，构建了一个大规模多模态理解评估基准。其诞生推动了多模态大模型在专业领域认知能力的精细化测评，为通用人工智能的发展提供了重要的评估基础设施。

当前挑战

MMMU数据集致力于解决多模态问答在跨学科专业场景中的挑战，其问题往往需要模型整合视觉信息与深层次领域知识进行推理，这对现有模型的泛化与认知能力提出了极高要求。在构建过程中，挑战主要体现在跨学科高质量数据的采集与标注，需确保图像与文本问题的精确对应，并覆盖不同难度层级。同时，多模态数据的结构化整合与格式统一，以及专业领域知识的权威性验证，均是数据集构建中需要克服的关键难题。

常用场景

经典使用场景

在人工智能与多模态学习领域，MMMU数据集作为一项跨学科视觉问答基准，其经典使用场景聚焦于评估大规模多模态模型在复杂专业任务中的综合认知能力。该数据集覆盖会计、艺术、医学等三十余个学科，通过融合文本与图像信息，要求模型进行深度推理与跨模态理解，为研究者提供了衡量模型在真实世界专业知识应用场景下的性能标尺。

解决学术问题

该数据集有效解决了多模态人工智能研究中模型泛化能力不足与学科知识融合困难的学术挑战。通过构建涵盖广泛学科领域的高质量多模态问题，MMMU为探索模型在跨领域知识迁移、细粒度视觉语义对齐以及复杂推理链建模等核心问题提供了标准化实验环境，推动了认知智能向专业级应用迈进的理论突破。

实际应用

在实际应用层面，MMMU数据集为开发专业领域的智能辅助系统奠定了评估基础。其涵盖的临床医学影像诊断、工程图纸解析、艺术史鉴证等场景，能够指导构建具备学科专家级理解能力的多模态助手，在智慧教育、专业咨询、科研辅助等垂直领域展现出重要的应用潜力与产业化价值。

数据集最近研究