five

MMMU/MMMU

收藏
Hugging Face2026-04-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/MMMU/MMMU
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个多学科的问答任务集合,涵盖了会计、农业、建筑与工程等多个领域。每个配置包含id、问题、选项、解释、多个图像以及主题难度、问题类型和子领域等元数据字段。数据集分为开发集、验证集和测试集,每个集的大小和示例数量都有详细说明。

This dataset is a multi-disciplinary collection of question-answering tasks, covering fields such as Accounting, Agriculture, Architecture_and_Engineering, and more. Each configuration includes features like id, question, options, explanation, multiple images, and various metadata fields like topic_difficulty, question_type, and subfield. The dataset is divided into dev, validation, and test sets, with detailed byte sizes and example counts provided for each split.
提供机构:
MMMU
原始信息汇总

数据集概述

基本信息

  • 语言: 英语
  • 许可证: Apache-2.0
  • 大小分类: 10K<n<100K
  • 任务分类:
    • 问答
    • 视觉问答
    • 多选题
  • 美观名称: mmmu

数据集结构

数据集包含多个配置,每个配置对应不同的领域,每个领域包含以下特征:

  • id: 字符串类型
  • question: 字符串类型
  • options: 字符串类型
  • explanation: 字符串类型
  • image_1image_7: 图像类型
  • img_type: 字符串类型
  • answer: 字符串类型
  • topic_difficulty: 字符串类型
  • question_type: 字符串类型
  • subfield: 字符串类型

数据集分割

每个配置包含三个分割:

  • dev: 开发集
  • validation: 验证集
  • test: 测试集

每个分割包含以下信息:

  • num_bytes: 字节数
  • num_examples: 示例数

数据集大小

每个配置的下载大小和数据集大小不同,具体数值如下:

配置名称 下载大小 数据集大小
Accounting 37363379 23996509.0
Agriculture 1158036990 1134964291.0
Architecture_and_Engineering 48763955 16913735.0
Art 585798641 273977108.0
Art_Theory 930525695 594091311.0
Basic_Medical_Science 84666454 53066131.0
Biology 410242502 142032356.0
Chemistry 108345562 39000499.0
Clinical_Medicine 160611488 110552292.0
Computer_Science 55640991 34559922.0
Design 142866617 97859324.0
Diagnostics_and_Laboratory_Medicine 603957093 196165419.0
Economics 20777635 13510782.0
Electronics 11602832 6482695.0
Energy_and_Power 35246567 16495369.0
Finance 29551521 13432987.0
Geography 374766631 145383776.0
History 232549641 125492903.0
Literature 132145895 66993788.0
Manage 51186888 33690913.0
Marketing 13146078 9322917.0
Materials 78365794 27801697.0
Math - -

以上信息总结了数据集的基本属性、结构、分割以及大小,为使用者提供了全面的数据集概览。

搜集汇总
数据集介绍
main_image_url
构建方式
在跨学科知识评估领域,MMMU数据集的构建体现了对专业深度与广度的双重追求。该数据集通过系统性地收集来自30个不同学科领域的专业考试题目,涵盖会计学、农业、艺术理论乃至基础医学等广泛主题。每个条目均包含多模态元素,整合了文本问题、多项选择选项以及最多七张相关图像,并辅以详细的解释说明。构建过程中,团队精心标注了题目难度、问题类型及所属子领域,确保数据在学科覆盖与认知层次上的均衡分布,为评估模型的多领域知识理解能力奠定了坚实基础。
使用方法
对于致力于多模态大模型评估的研究者而言,MMMU数据集提供了标准化的测试框架。用户可通过HuggingFace平台便捷加载数据集,并依据具体学科配置选择相应子集进行探索。数据集已预先划分为开发集、验证集和测试集,便于进行模型训练、超参数调优与最终性能评测。在实际应用中,研究者可结合问题文本、关联图像及选项信息,驱动模型生成预测答案,并利用提供的标准答案与解释进行验证与误差分析,从而系统评估模型在跨学科多模态理解任务上的综合表现。
背景与挑战
背景概述
在人工智能迈向通用智能的演进历程中,多模态理解能力成为衡量模型认知深度的关键标尺。MMMU数据集由研究团队于2023年构建,旨在应对跨学科知识融合与视觉语言联合推理的核心研究问题。该数据集涵盖艺术、医学、工程等三十余个学科,通过融合文本问题与多样化的图像信息,构建了一个大规模多模态理解评估基准。其诞生推动了多模态大模型在专业领域认知能力的精细化测评,为通用人工智能的发展提供了重要的评估基础设施。
当前挑战
MMMU数据集致力于解决多模态问答在跨学科专业场景中的挑战,其问题往往需要模型整合视觉信息与深层次领域知识进行推理,这对现有模型的泛化与认知能力提出了极高要求。在构建过程中,挑战主要体现在跨学科高质量数据的采集与标注,需确保图像与文本问题的精确对应,并覆盖不同难度层级。同时,多模态数据的结构化整合与格式统一,以及专业领域知识的权威性验证,均是数据集构建中需要克服的关键难题。
常用场景
经典使用场景
在人工智能与多模态学习领域,MMMU数据集作为一项跨学科视觉问答基准,其经典使用场景聚焦于评估大规模多模态模型在复杂专业任务中的综合认知能力。该数据集覆盖会计、艺术、医学等三十余个学科,通过融合文本与图像信息,要求模型进行深度推理与跨模态理解,为研究者提供了衡量模型在真实世界专业知识应用场景下的性能标尺。
解决学术问题
该数据集有效解决了多模态人工智能研究中模型泛化能力不足与学科知识融合困难的学术挑战。通过构建涵盖广泛学科领域的高质量多模态问题,MMMU为探索模型在跨领域知识迁移、细粒度视觉语义对齐以及复杂推理链建模等核心问题提供了标准化实验环境,推动了认知智能向专业级应用迈进的理论突破。
实际应用
在实际应用层面,MMMU数据集为开发专业领域的智能辅助系统奠定了评估基础。其涵盖的临床医学影像诊断、工程图纸解析、艺术史鉴证等场景,能够指导构建具备学科专家级理解能力的多模态助手,在智慧教育、专业咨询、科研辅助等垂直领域展现出重要的应用潜力与产业化价值。
数据集最近研究
最新研究方向
在视觉问答与多模态推理领域,MMMU数据集凭借其跨学科、多图像的复杂结构,正成为评估大型多模态模型认知深度的关键基准。该数据集覆盖会计、医学、艺术等三十余个专业领域,要求模型融合文本与视觉信息进行高阶推理,这直接呼应了当前通用人工智能向专业领域渗透的研究热潮。前沿探索聚焦于提升模型在细粒度图像理解、跨模态知识对齐及领域自适应方面的能力,相关研究不仅推动了多模态架构的创新,也为教育、医疗等垂直行业的智能化应用奠定了评估基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作