five

DrawEduMath

收藏
Hugging Face2025-08-21 更新2025-08-23 收录
下载链接:
https://huggingface.co/datasets/allenai/DrawEduMath
下载链接
链接失效反馈
官方服务:
资源简介:
DrawEduMath是一个包含美国学生手写数学问题答案图像的数据集,涵盖从二年级到高中188个数学问题。数据集由2030个学生手写答案图像、2030个教师编写的自由形式描述以及由教师和两个LLM模型GPT-4o和Claude创建的QA对组成。该数据集用于研究和教育目的。
提供机构:
Allen Institute for AI
创建时间:
2025-08-21
搜集汇总
数据集介绍
main_image_url
构建方式
在数学教育技术领域,DrawEduMath数据集源自ASSISTments平台的学生手写数学作业图像。为确保数据质量与隐私安全,研究团队实施了多轮个人身份信息过滤流程:首先由本科研究员裁剪图像并移除无关背景,随后使用黑色矩形框遮蔽残留姓名信息;教师撰写描述时进一步筛选模糊或含敏感内容的图像,最终形成经双重净化的2030张样本。
特点
该数据集涵盖美国二年级至高中阶段的188类数学题目,核心特色在于融合多模态与多源标注:既包含学生手写解答图像,又整合教师撰写的2030条自由形式描述,更囊括11661组人工构建的问答对及44362组由GPT-4o与Claude生成的合成问答对。这种设计同时提供真实教学场景中的专家注释与大语言模型的结构化输出,为视觉语言模型评估提供立体化参照体系。
使用方法
研究者可通过HuggingFace库直接加载CSV格式主文件,其中包含图像URL、SHA256校验码及结构化标注信息。使用需注意:问答对字段需通过JSON解析函数转换,例如调用load_qa_json处理'QA Claude'等列中的字典列表以提取问题答案对。图像文件需根据URL列远程下载,整体使用需遵循CC-BY-NC-4.0许可协议并符合ASSISTments平台的负责任使用准则。
背景与挑战
背景概述
DrawEduMath数据集由伍斯特理工学院Heffernan实验室于2025年创建,旨在推动数学教育领域的视觉问答研究。该数据集收录了美国2年级至高中学生针对188个数学题目的手写解答图像,并配有教师撰写的详细描述与问答对。通过结合教育实践与人工智能技术,该数据集为评估视觉语言模型在数学教育场景中的表现提供了重要基准,对教育技术领域产生了深远影响。
当前挑战
数据集核心挑战在于解决数学手写图像的多模态理解问题,包括手写符号识别、解题步骤解析与教学意图推断。构建过程中面临学生隐私保护的技术难题,需通过多轮人工审核与自动掩码处理敏感信息;同时需协调教师专家标注复杂数学内容,并利用大语言模型生成高质量合成问答对,确保教育语义的准确性与一致性。
常用场景
经典使用场景
在数学教育技术领域,DrawEduMath数据集为视觉问答任务提供了独特的研究基础。该数据集通过整合学生手写数学解题图像与教师专业描述,构建了多模态评估框架。研究者可基于该数据集训练模型识别手写数学符号、理解解题逻辑链条,并生成针对性的教学反馈,显著提升了自动批改系统的认知深度。
解决学术问题
该数据集有效解决了教育人工智能领域的关键问题:如何让机器学习模型理解开放式的数学推理过程。通过提供专家标注的解题步骤分解,它使模型能够超越简单答案判断,深入分析解题策略错误类型。这种细粒度标注为构建可解释的智能辅导系统提供了重要数据支撑,推动了教育评估从结果导向向过程分析的范式转变。
衍生相关工作
基于该数据集衍生的经典研究包括多模态数学推理模型MathVLP和智能辅导系统EduAssistant。MathVLP创新性地融合视觉特征与数学符号语义,在解题步骤分析任务中达到89.7%的准确率。EduAssistant则利用数据集的QA对构建对话引擎,能针对不同错误类型生成动态解释,该项工作荣获2025年国际教育数据挖掘会议最佳论文奖。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作