lmms-lab/ScienceQA-IMG

Name: lmms-lab/ScienceQA-IMG
Creator: lmms-lab
Published: 2024-03-08 04:53:18
License: 暂无描述

Hugging Face2024-03-08 更新2024-06-22 收录

下载链接：

https://hf-mirror.com/datasets/lmms-lab/ScienceQA-IMG

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个基于[derek-thomas/ScienceQA](https://huggingface.co/datasets/derek-thomas/ScienceQA)的格式化版本，仅包含图像实例的数据集。它用于`lmms-eval`管道中，以便一键评估大规模多模态模型。数据集包含图像、问题、选择、答案、提示、任务、年级、科目、主题、类别、技能、讲座和解决方案等字段，并分为训练集、验证集和测试集。

提供机构：

lmms-lab

原始信息汇总

数据集概述

数据集信息

特征

image: 图像类型
question: 字符串类型
choices: 字符串序列
answer: 8位整数类型
hint: 字符串类型
task: 字符串类型
grade: 字符串类型
subject: 字符串类型
topic: 字符串类型
category: 字符串类型
skill: 字符串类型
lecture: 字符串类型
solution: 字符串类型

数据分割

train:
- 字节数: 206256098.99371365
- 样本数: 6218
validation:
- 字节数: 69283708.62697478
- 样本数: 2097
test:
- 字节数: 65753122.30087244
- 样本数: 2017

数据大小

下载大小: 663306124
数据集大小: 341292929.9215609

配置

config_name: default
- data_files:
  - train: data/train-*
  - validation: data/validation-*
  - test: data/test-*

搜集汇总

数据集介绍

构建方式

ScienceQA-IMG数据集是基于derek-thomas/ScienceQA数据集的精炼版本，专门筛选出包含图像实例的部分。该数据集通过整合多模态信息，特别是图像与科学问题的结合，旨在为大规模多模态模型（LMMs）的评估提供标准化的测试平台。数据集的构建过程中，图像、问题、选项、答案等关键要素被系统化地组织，确保了数据的高质量和一致性，从而为模型评估提供了坚实的基础。

特点

ScienceQA-IMG数据集的显著特点在于其多模态的特性，特别是图像与科学问题的紧密结合。每个样本不仅包含一个图像，还附带相关的问题、多个选项、正确答案以及详细的解释，这为模型提供了丰富的上下文信息。此外，数据集还提供了任务类型、年级、学科、主题等元数据，使得研究者能够针对特定领域或教育层次进行深入分析和模型优化。

使用方法

ScienceQA-IMG数据集主要用于评估和训练大规模多模态模型，特别是在科学问题解答领域。使用者可以通过HuggingFace的datasets库轻松加载该数据集，并利用其提供的图像、问题、选项和答案进行模型的训练和测试。数据集的结构化设计使得研究者能够方便地提取和分析特定类型的数据，从而优化模型的性能。此外，数据集的元数据信息也为研究者提供了多维度的分析视角，有助于更全面地理解模型的表现。

背景与挑战

背景概述

ScienceQA-IMG数据集是由lmms-lab团队在2022年推出的，旨在推动大规模多模态模型（LMMs）的发展。该数据集是基于derek-thomas/ScienceQA的精简版本，专注于包含图像实例的科学问题解答任务。其核心研究问题是如何通过多模态推理来提高科学问题解答的准确性和效率。该数据集的推出不仅为多模态模型的评估提供了标准化的工具，还为科学教育领域的智能化发展提供了新的研究方向。

当前挑战

ScienceQA-IMG数据集在构建过程中面临的主要挑战包括：首先，如何从原始数据集中筛选出高质量的图像实例，确保数据的多样性和代表性；其次，多模态模型的评估需要综合考虑图像和文本的交互，这对模型的设计和训练提出了更高的要求。此外，科学问题的复杂性和多样性也增加了数据标注和模型推理的难度，要求研究人员在数据处理和模型优化方面进行深入探索。

常用场景

经典使用场景

在多模态模型评估领域，lmms-lab/ScienceQA-IMG数据集以其丰富的图像和科学问题内容，成为评估大规模多模态模型（LMMs）性能的经典工具。该数据集通过结合图像、问题、选项和答案等多模态信息，为模型提供了复杂且真实的科学问题解答场景，从而能够全面评估模型在视觉与语言理解上的综合能力。

解决学术问题

该数据集解决了多模态学习中长期存在的跨模态理解与推理难题。通过提供图像与科学问题的结合，它促使模型不仅需要理解图像内容，还需结合问题进行深度推理，从而推动了多模态模型在复杂任务中的表现。这一进展对于提升模型在科学教育、知识问答等领域的应用具有重要意义。

衍生相关工作

基于lmms-lab/ScienceQA-IMG数据集，研究者们开发了多种多模态模型评估框架和方法，如lmms-eval管道，这些工具极大地简化了大规模多模态模型的评估流程。此外，该数据集还激发了关于多模态推理和解释生成的新研究，推动了多模态学习在科学问答和教育技术领域的深入应用。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集