THU-KEG/MM_Math

Name: THU-KEG/MM_Math
Creator: THU-KEG
Published: 2024-06-30 14:20:05
License: 暂无描述

Hugging Face2024-06-30 更新2024-07-06 收录

下载链接：

https://hf-mirror.com/datasets/THU-KEG/MM_Math

下载链接

链接失效反馈

官方服务：

资源简介：

MM_Math数据集是一个多模态数学数据集，收集自中国中学的真实考试。所有数学问题均为开放式，旨在评估当前多模态模型的数学问题解决能力。数据集标注了细粒度的三维标签：难度、年级和知识点。难度级别基于学生考试的平均分数确定，年级标签来源于收集问题的不同年级的教育内容，知识点由教师根据问题内容分类。数据集包含两个文件：Image.zip（问题中使用的图像）和MM_Math.jsonl（收集的中学考试问题，包括问题陈述、解决过程和三维标注）。

We introduce our multimodal mathematics dataset, MM-MATH, collected from real middle school exams in China. All the math problems are open-ended to evaluate the mathematical problem-solving abilities of current multimodal models. MM-MATH is annotated with fine-grained three-dimensional labels: difficulty, grade, and knowledge points. The difficulty level is determined based on the average scores of student exams, the grade labels are derived from the educational content of different grades from which the problems were collected, and the knowledge points are categorized by teachers according to the problems content. The dataset includes two main documents: Image.zip containing images used in the problems and MM_Math.jsonl containing the exam questions, solutions, and annotations. The data format is standardized with fields for question text, file names, solution text, year, difficulty, and knowledge points, all formatted in LaTeX code.

提供机构：

THU-KEG

搜集汇总

数据集介绍

构建方式

在数学教育评估领域，MM_Math数据集通过系统化采集中国中学真实考试题目构建而成。其构建过程严谨，所有数学问题均为开放式题型，旨在全面评估多模态模型的解题能力。数据标注采用精细的三维标签体系：难度级别依据学生考试平均分确定，年级标签源自题目对应的教育阶段，知识点分类则由专业教师根据题目内容进行标注，确保了数据来源的可靠性与标注的准确性。

特点

该数据集的核心特点在于其多维度的结构化标注与真实场景的紧密结合。每个问题均附带详细的解题过程文本，并以LaTeX代码形式呈现，保证了数学表达式的精确性。图像与文本的有机结合，使得数据集能够有效支持多模态学习任务。三维标签体系不仅覆盖难度、年级和知识点，还通过实际考试数据校准，为模型性能评估提供了丰富的层次化基准，显著提升了数据集的实用价值与研究深度。

使用方法

使用MM_Math数据集时，研究者可通过解压Image.zip获取问题图像，并读取MM_Math.jsonl文件中的结构化数据。数据格式统一为JSON对象，包含问题陈述、图像文件名、解题过程及三维标注信息。该数据集适用于训练和评估多模态数学问题求解模型，用户可依据难度、年级或知识点标签进行数据筛选，以针对性地开展实验分析，推动数学教育智能化领域的发展。

背景与挑战

背景概述

在人工智能与教育技术融合的浪潮中，多模态数学问题求解成为评估模型认知能力的关键领域。THU-KEG/MM_Math数据集由清华大学知识工程实验室于近年构建，旨在通过真实中学考试题目，系统检验多模态模型在开放场景下的数学推理与解题能力。该数据集以精细的三维标注体系——难度、年级与知识点为核心特色，其难度标签基于学生考试成绩动态生成，年级与知识点则由教育专家依据教学大纲严谨划分，为数学智能教育研究提供了结构化的基准数据，推动了跨模态理解与符号推理技术的交叉发展。

当前挑战

该数据集致力于解决多模态数学问题求解中的核心挑战：模型需同时解析文本描述与图像中的数学符号、几何图形及图表数据，并生成符合逻辑的解题步骤，这对跨模态对齐与符号推理能力提出了极高要求。在构建过程中，挑战主要集中于数据标注的复杂性与一致性：如何依据动态考试分数客观量化题目难度，以及依赖教师经验对知识点进行标准化分类，均需克服教育场景的多样性与主观性，确保标注体系兼具学术严谨性与实际教学代表性。

常用场景

经典使用场景

在数学教育技术领域，MM_Math数据集为评估多模态模型的数学问题解决能力提供了基准平台。该数据集源自中国中学真实考试题目，涵盖开放式的数学问题，结合图像与文本描述，模拟了实际学习环境中的复杂情境。研究者利用其精细标注的难度、年级和知识点三维标签，系统性地测试模型在解析图文混合数学问题时的推理与计算性能，推动了多模态人工智能在学术评估方向的发展。

衍生相关工作

基于MM_Math数据集，学术界衍生了一系列经典研究工作，主要集中在多模态数学问题求解模型的创新上。例如，研究者开发了结合视觉编码器与数学符号处理器的混合架构，以提升模型对图文混合问题的理解能力。此外，该数据集还催生了针对难度自适应学习、知识点追踪等任务的算法研究，推动了智能教育领域的技术演进，并为后续更大规模多模态数学数据集的构建提供了参考范式。

数据集最近研究