lmms-lab/MMMU

Name: lmms-lab/MMMU
Creator: lmms-lab
Published: 2024-03-08 05:09:42
License: 暂无描述

Hugging Face2024-03-08 更新2024-06-22 收录

下载链接：

https://hf-mirror.com/datasets/lmms-lab/MMMU

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个合并版本的MMMU数据集，用于评估大规模多模态模型。数据集包含多个特征，如id、问题、选项、解释、多个图像字段、图像类型、答案、主题难度、问题类型和子领域。数据集分为开发集、验证集和测试集，分别包含150、900和10500个样本。数据集的总下载大小为3377778136字节，总数据集大小为3676285328字节。

提供机构：

lmms-lab

原始信息汇总

数据集概述

数据集信息

特征

id: 字符串类型
question: 字符串类型
options: 字符串类型
explanation: 字符串类型
image_1 至 image_7: 图像类型
img_type: 字符串类型
answer: 字符串类型
topic_difficulty: 字符串类型
question_type: 字符串类型
subfield: 字符串类型

数据分割

dev:
- 字节数: 57719107.0
- 样本数: 150
validation:
- 字节数: 347519954.0
- 样本数: 900
test:
- 字节数: 3271046267.0
- 样本数: 10500

数据大小

下载大小: 3377778136
数据集大小: 3676285328.0

配置

config_name: default
- data_files:
  - dev: data/dev-*
  - validation: data/validation-*
  - test: data/test-*

搜集汇总

数据集介绍

构建方式

LMMS-lab/MMMU数据集的构建，是通过整合多学科、多模态理解与推理的庞大语料库而实现的。该数据集涵盖了文本、图像等多种模态的数据，每一项记录均包括问题、选项、解释、相关图像以及答案等字段，构建了一个综合性的评价体系，旨在加速大规模多模态模型（LMMs）的开发。

特点

该数据集显著的特点在于其多模态与跨学科的结合，不仅包含了丰富的文本信息，还整合了大量的图像数据，以支持多模态理解任务。其数据分布均衡，难度分级明确，能够全面评估模型在多模态推理任务中的表现。此外，数据集的规模宏大，包含开发集、验证集和测试集，为模型的训练与评估提供了充足的数据支持。

使用方法

用户可以通过HuggingFace的dataset库方便地加载LMMS-lab/MMMU数据集。数据集分为开发集、验证集和测试集，每个集合都有相应的路径配置，可以直接通过路径访问数据进行加载。加载后，用户可以根据自己的需求，利用数据集中的多模态信息进行模型的训练、验证和测试，以评估模型的多模态理解和推理能力。

背景与挑战

背景概述

lmms-lab/MMMU数据集，作为大规模多模态模型评估套件的一部分，旨在推动大规模多模态模型（LMMs）的发展。该数据集由Yue Xiang等人于2023年创建，依托于MMMU基准，为专家级通用人工智能提供了一项多学科、多模态理解和推理的评测标准。数据集整合了文本、图像等多种模态的信息，其设计理念是为了加速大型多模态模型在理解复杂场景和任务时的性能评估，对多模态学习领域产生了显著影响。

当前挑战

在构建lmms-lab/MMMU数据集的过程中，研究人员面临了多方面的挑战。首先，多模态数据的整合与同步是一大难题，需要确保不同来源的数据在语义上的一致性。其次，数据集规模的扩大带来了标注和质量控制的挑战，必须保证数据的准确性和多样性。此外，针对多模态理解任务的复杂性，如何设计合理的评估指标和测试场景也是当前面临的挑战之一。

常用场景

经典使用场景

在多模态理解与推理领域，lmms-lab/MMMU数据集以其丰富的数据特征和大规模的数据量为研究者提供了一个理想的实验平台。该数据集整合了文本、图像以及答案等多种信息，经典的使用场景在于评估大型多模态模型在多学科理解任务上的性能，如进行问题回答、图像识别以及跨模态推理等。

衍生相关工作

MMMU数据集的发布催生了大量相关研究工作，如多模态知识图谱的构建、多学科融合推理模型的开发等。这些研究进一步拓宽了多模态理解的应用范围，促进了人工智能技术的发展。

数据集最近研究