five

Standards-Targeted Educational Math dataset

收藏
arXiv2025-10-08 更新2025-11-19 收录
下载链接:
https://hf-mirror.com/collections/bryanchrist/edumath
下载链接
链接失效反馈
官方服务:
资源简介:
EDUMATH数据集是首个针对教育数学问题生成的标准对齐数据集,由教师标注,包含超过11,000个数学问题,用于训练大语言模型生成符合学生兴趣和能力水平的数学教育问题。该数据集由弗吉尼亚大学的研究人员开发,旨在解决教师在定制数学问题时面临的时间和资源限制问题。数据集内容涵盖了3至5年级的数学标准,并为每个问题提供了自然语言的解决方案。该数据集的创建过程包括对现有数学问题数据集的标注、LLM生成的数学问题的评估和筛选,以及最终的数据集构建。数据集的应用领域为K-12数学教育,旨在帮助学生更好地理解和掌握数学概念。

The EDUMATH dataset is the first standard-aligned dataset dedicated to educational math problem generation. Annotated by teachers, it contains over 11,000 math problems, and is designed to train large language models (LLMs) to generate math educational problems tailored to students' interests and proficiency levels. Developed by researchers at the University of Virginia, this dataset aims to address the time and resource constraints faced by teachers when creating customized math problems. Its content covers math curriculum standards for grades 3 through 5, and provides natural language solutions for each problem. The dataset creation process includes annotating existing math problem datasets, evaluating and filtering math problems generated by LLMs, and constructing the final dataset. The dataset is applied in K-12 math education, with the goal of helping students better understand and master mathematical concepts.
提供机构:
弗吉尼亚大学
创建时间:
2025-10-08
搜集汇总
数据集介绍
main_image_url
构建方式
在数学教育领域,标准化教学资源的构建对提升学习效果至关重要。该数据集通过多阶段流程构建:首先对现有ASDIV数据集中的3-5年级数学应用题进行人工标注,识别其对应的美国弗吉尼亚州数学课程标准;随后利用大型语言模型生成3000余道合成题目,并由1372名教师通过众包平台进行四维标注,包括可解性、答案准确性、教育适宜性和标准对齐性;最终结合标注通过的题目与原有标注数据,形成包含2577道题目的高质量数据集。
特点
该数据集在数学教育资源中具有显著特色:作为首个完全由教师验证的标准化数学应用题数据集,其题目均配备可读性强的链式推理解答,覆盖3-5年级8个核心数学主题的38种标准组合。通过复合可读性指标与BERTScore评估显示,题目复杂度与人类编写数据相当,平均题目长度53.9个词元,在保持教育适用性的同时实现了标准对齐的细粒度控制。
使用方法
该数据集主要服务于标准化数学应用题的生成研究与实践。使用者可通过监督微调训练12B参数模型,结合卡尼曼-特沃斯基优化与文本分类器过滤,构建高性能题目生成器。对于无需训练的场景,直接使用数据集中的少样本示例进行提示工程,即可使30B参数模型在标准对齐任务上超越现有基线。教育工作者可依据特定年级与标准组合,生成符合学生兴趣的个性化题目,经实验验证其教学效果与人类编写题目相当且更受学生青睐。
背景与挑战
背景概述
Standards-Targeted Educational Math数据集由弗吉尼亚大学研究团队于2025年创建,旨在解决K-12数学教育中个性化教学资源匮乏的核心问题。该数据集聚焦于标准对齐的教育性数学应用题生成,通过融合人类专家与大语言模型的协同标注机制,构建了包含2577个高质量题目的大规模语料库。其创新性在于首次将美国弗吉尼亚州数学课程标准与可读性解题步骤相结合,为自适应数学教育系统的开发提供了关键数据支撑,显著推动了教育技术与课程标准的深度融合。
当前挑战
该数据集面临双重挑战:在领域问题层面,需确保生成的数学应用题同时满足可解性、答案精确性、教育适用性与标准对齐性四项严苛标准,这对模型的多维度推理能力提出极高要求;在构建过程中,标注工作需协调教师专业知识与模型标注的平衡,既要克服人工标注成本高昂的瓶颈,又要解决自动标注对题目语义细微差异的识别难题,例如对解题步骤可读性与数学概念精确性的联合评估。
常用场景
经典使用场景
在K-12数学教育领域,Standards-Targeted Educational Math数据集被广泛用于训练和评估大型语言模型生成符合教育标准的数学应用题。该数据集通过教师标注确保了问题的可解性、准确性、教育适宜性和标准对齐性,为教育技术研究提供了高质量的基准数据。其经典应用场景包括开发个性化学习工具,帮助教师根据学生的兴趣和能力水平自动生成定制化的数学练习题目,从而提升教学效率和学生的学习兴趣。
解决学术问题
该数据集解决了教育技术中一个关键学术问题:如何确保自动生成的数学应用题既符合课程标准又具备教育实用性。传统方法依赖人工编写,难以大规模个性化,而该数据集通过结合专家标注和模型优化,提供了可训练的数据资源,支持模型生成具有可读性解答、对齐具体数学标准的问题。这不仅推动了自然语言处理在教育领域的应用,还为解决教师资源紧张、学生个性化学习需求等教育挑战提供了技术基础。
衍生相关工作
基于该数据集,研究社区衍生出多项经典工作,包括EDUMATH模型的开发,这些模型通过监督微调和优化技术实现了标准对齐数学应用题生成的先进性能。此外,该数据集促进了自动文本分类器的训练,用于过滤低质量输出,并启发了对多模态数学问题生成和跨年级标准适配的后续研究。这些工作共同推动了教育人工智能的发展,为更广泛学科的标准对齐内容生成奠定了基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作