JMMMU

Hugging Face2024-09-30 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/JMMMU/JMMMU

下载链接

链接失效反馈

官方服务：

资源简介：

JMMMU数据集是一个多领域的选择题和视觉问答题集合，涵盖会计、农业、计算机科学等多个领域。每个领域包含多个特征，如问题、选项、解释、图像及其相关信息、答案等。数据集的语言为日语，许可证为MIT。

创建时间：

2024-09-30

原始信息汇总

JMMMU 数据集概述

基本信息

语言: 日语
许可证: MIT
数据量: 1K < n < 10K
任务类别:
- 问答
- 视觉问答
- 多选题
数据集名称: JMMMU

数据集配置

1. Accounting

特征:
- id: string
- question: string
- options: string
- explanation: string
- image_1: image
- image_1_license: string
- image_1_attribution: string
- image_1_use_original_mmmu: bool
- image_2: image
- image_2_license: string
- image_2_attribution: string
- image_2_use_original_mmmu: bool
- image_3: image
- image_3_license: string
- image_3_attribution: string
- image_3_use_original_mmmu: bool
- image_4: image
- image_4_license: string
- image_4_attribution: string
- image_4_use_original_mmmu: bool
- image_5: image
- image_5_license: string
- image_5_attribution: string
- image_5_use_original_mmmu: bool
- image_6: image
- image_6_license: string
- image_6_attribution: string
- image_6_use_original_mmmu: bool
- image_7: image
- image_7_license: string
- image_7_attribution: string
- image_7_use_original_mmmu: bool
- img_type: string
- answer: string
- topic_difficulty: string
- question_type: string
- subfield: string
分割:
- test: 30个样本, 1745326字节
下载大小: 1755488字节
数据集大小: 1745326字节

2. Agriculture

特征: 同上
分割:
- test: 30个样本, 119223364字节
下载大小: 119235669字节
数据集大小: 119223364字节

3. Architecture_and_Engineering

特征: 同上
分割:
- test: 30个样本, 1082540字节
下载大小: 1094866字节
数据集大小: 1082540字节

4. Basic_Medical_Science

特征: 同上
分割:
- test: 30个样本, 4187246字节
下载大小: 4206073字节
数据集大小: 4187246字节

5. Biology

特征: 同上
分割:
- test: 30个样本, 8624655字节
下载大小: 8634266字节
数据集大小: 8624655字节

6. Chemistry

特征: 同上
分割:
- test: 30个样本, 1409626字节
下载大小: 1422391字节
数据集大小: 1409626字节

7. Clinical_Medicine

特征: 同上
分割:
- test: 30个样本, 10885064字节
下载大小: 10900204字节
数据集大小: 10885064字节

8. Computer_Science

特征: 同上
分割:
- test: 30个样本, 2241115字节
下载大小: 2258448字节
数据集大小: 2241115字节

9. Design

特征: 同上
分割:
- test: 30个样本, 17932660字节
下载大小: 16244765字节
数据集大小: 17932660字节

10. Diagnostics_and_Laboratory_Medicine

特征: 同上
分割:
- test: 30个样本, 37109516字节
下载大小: 37099650字节
数据集大小: 37109516字节

11. Economics

特征: 同上
分割:
- test: 30个样本, 1927531字节
下载大小: 1907159字节
数据集大小: 1927531字节

12. Electronics

特征: 同上
分割:
- test: 30个样本, 1907159字节
下载大小: 1907159字节
数据集大小: 1927531字节

搜集汇总

数据集介绍

构建方式

JMMMU数据集的构建基于多学科领域的视觉问答任务，涵盖了会计、农业、建筑与工程、基础医学、生物学、化学、临床医学、计算机科学、设计、诊断与实验室医学、经济学和电子学等多个子领域。每个子领域的数据通过精心设计的问答对和相关的图像资源进行组织，确保数据的多样性和广泛性。数据集中的每个问题都附有详细的解释和多个选项，图像资源则通过明确的许可和归属信息进行标注，确保数据的合法性和可追溯性。

特点

JMMMU数据集的特点在于其跨学科的广泛覆盖和丰富的视觉问答内容。每个子领域的数据集均包含30个测试样本，每个样本由问题、选项、解释和多个图像组成。图像资源经过精心挑选，涵盖了不同难度和类型的问题，能够有效支持多模态学习任务。此外，数据集中的每个图像都附有详细的许可和归属信息，确保数据的透明性和合规性。

使用方法

JMMMU数据集适用于多模态学习和视觉问答任务的研究与开发。用户可以通过加载数据集中的问题和图像资源，结合问题类型和难度信息，进行模型的训练和评估。数据集中的解释和选项信息可用于生成模型的输出和验证其准确性。此外，用户可以根据图像资源的许可信息，合法地使用和共享数据，确保研究的合规性和透明度。

背景与挑战

背景概述

JMMMU数据集是一个多模态问答数据集，专注于结合视觉与文本信息的多选题任务。该数据集由多个学科领域构成，涵盖会计、农业、建筑与工程、基础医学、生物学、化学、临床医学、计算机科学、设计、诊断与实验室医学、经济学和电子学等广泛领域。其核心研究问题在于如何通过多模态数据（如图像与文本的结合）提升问答系统的性能，尤其是在复杂学科领域的应用。该数据集的创建旨在推动多模态学习与跨学科知识理解的研究，为相关领域的模型训练与评估提供了丰富的资源。

当前挑战

JMMMU数据集面临的挑战主要体现在两个方面。首先，多模态数据的融合与理解是其核心难题，尤其是在涉及复杂学科知识时，模型需要同时处理图像与文本信息，并从中提取有效特征以回答问题。其次，数据集的构建过程中，确保图像与文本的准确匹配、标注的精确性以及多学科知识的覆盖度是极具挑战的任务。此外，数据集的规模与多样性要求高质量的图像来源与复杂的标注流程，这对数据收集与处理提出了较高的技术要求。

常用场景

经典使用场景

JMMMU数据集在视觉问答（Visual Question Answering, VQA）和多选题任务中展现了其独特的价值。该数据集通过结合图像和文本信息，提供了丰富的多模态数据，适用于训练和评估模型在复杂场景下的推理能力。其经典使用场景包括跨领域的知识问答，如医学、工程、农业等，模型需要结合图像内容和文本问题，选择正确的答案。

衍生相关工作

JMMMU数据集衍生了一系列经典研究工作，特别是在多模态学习和视觉问答领域。基于该数据集的研究成果包括改进的视觉-语言联合模型、跨领域知识推理算法以及多模态数据增强技术。这些工作不仅提升了模型在JMMMU数据集上的表现，也为其他多模态任务提供了新的思路和方法。

数据集最近研究