MATHDIAL

Name: MATHDIAL
Creator: 瑞士联邦理工学院
Published: 2023-10-23 20:00:01
License: 暂无描述

arXiv2023-10-23 更新2024-06-21 收录

下载链接：

https://github.com/eth-nlped/mathdial

下载链接

链接失效反馈

官方服务：

资源简介：

MATHDIAL是一个包含3000个一对一教师-学生辅导对话的数据集，专注于多步骤数学推理问题。该数据集由瑞士联邦理工学院和达姆施塔特工业大学的研究团队创建，通过模拟学生常见错误，结合人类教师的指导，旨在提高对话辅导系统的教学效果。MATHDIAL不仅提供了丰富的教学质量评估，还通过自动和人工评估验证了其在交互式教学环境中的有效性。数据集的公开发布，为研究和开发更有效的对话辅导模型提供了重要资源。

MATHDIAL is a dataset containing 3,000 one-on-one teacher-student tutoring dialogues focused on multi-step mathematical reasoning problems. It was developed by a research team from ETH Zurich and Technische Universität Darmstadt. By simulating common mistakes made by students and combining guidance from human teachers, it aims to improve the teaching effectiveness of dialogue tutoring systems. MATHDIAL not only provides rich teaching quality assessment resources, but also verifies its effectiveness in interactive teaching environments through both automatic and manual evaluations. The public release of this dataset offers an important resource for researching and developing more effective dialogue tutoring models.

提供机构：

瑞士联邦理工学院

创建时间：

2023-05-24

搜集汇总

数据集介绍

构建方式

在数学教育领域，构建高质量的对话辅导数据集面临隐私与数据质量的双重挑战。MATHDIAL采用了一种创新的半合成数据收集框架，将人类教师与大型语言模型（LLM）相结合。该框架首先基于GSM8k数学应用题，通过温度采样从LLM中生成多样化的学生错误解法，并筛选出最常见的错误类型作为对话基础。随后，招募具有教学经验的专家教师，在同步交互环境中与模拟学生的LLM进行一对一辅导对话。教师依据包含问题陈述、正确答案及学生错误解法的背景信息，运用脚手架式提问策略引导学生逐步纠正错误，直至问题解决或对话超时。整个过程确保了数据的教学合理性与对话自然性。

特点

MATHDIAL数据集在数学对话辅导领域展现出多方面的显著特点。其核心在于深度融合了教学理论与数据构建，通过详尽的教师行为标注体系——涵盖聚焦提问、探究引导、直接告知及通用对话四类策略——系统化地捕捉了辅导过程中的教学逻辑。数据集规模较大，包含约3000段对话，且每段对话均以多步数学推理问题为基础，并完整标注了学生困惑点、解题步骤及对话解决状态。此外，数据集具有较高的语言多样性与对话连贯性，其二元组熵值与话语承接度指标均优于或媲美同类数据集。这些丰富的教学属性与结构化注释为训练具有教学意识而非单纯解题能力的对话模型提供了坚实基础。

使用方法

MATHDIAL数据集为开发与评估对话辅导系统提供了多维度的应用途径。研究者可将其用于微调语言模型，专注于辅导响应生成任务，即根据对话历史、数学问题及学生错误信息，生成符合教学策略的教师回应。数据集提供的分步解答、学生困惑及教师行为标签可作为关键背景信息输入模型，以提升生成内容的正确性与教学适宜性。此外，数据集支持交互式端到端评估，即可将训练后的辅导模型与模拟学生的LLM进行对话，综合衡量学生解题成功率与教师过早揭示答案之间的平衡。这种使用方法不仅检验模型的单轮响应质量，更能评估其在整个辅导会话中的长期教学效果与泛化能力。

背景与挑战

背景概述

MATHDIAL数据集由苏黎世联邦理工学院、达姆施塔特工业大学及南洋理工大学等机构的研究团队于2023年联合构建，旨在解决自动对话辅导系统领域高质量数据稀缺的核心问题。该数据集以数学推理问题为背景，通过创新框架将人类教师与模拟学生错误的大型语言模型相结合，生成了约3000个一对一师生辅导对话。其核心研究聚焦于提升对话辅导系统的教学质量和公平性，通过引入脚手架式提问策略，促进学生在多步骤数学问题中的探索性学习，为教育个性化与可及性研究提供了关键数据支撑。

当前挑战

MATHDIAL致力于解决数学对话辅导中模型生成反馈事实错误或过早揭示答案的挑战，其构建过程面临双重困难：在领域层面，需确保模拟学生行为的真实性与教学策略的多样性，避免大型语言模型因算术误差或行为不一致降低数据可信度；在数据构建层面，需平衡人类教师与合成数据的协作，克服隐私顾虑与标注成本限制，同时维持对话的连贯性、教学深度及对新问题的泛化能力。

常用场景

经典使用场景

在数学教育领域，MATHDIAL数据集为对话式辅导系统的开发提供了关键资源。该数据集通过模拟教师与学生的交互对话，聚焦于多步骤数学推理问题的教学场景。其经典应用体现在训练和评估自动辅导模型，特别是针对如何通过脚手架式提问引导学生理解概念错误，而非直接揭示答案。研究者利用该数据集微调语言模型，使其能够生成符合教学策略的回应，从而提升辅导的交互质量与教育效果。

实际应用

在实际应用中，MATHDIAL数据集可用于开发智能辅导系统，辅助数学课堂或在线学习平台。这些系统能够模拟一对一辅导会话，通过自然语言交互帮助学生解决数学问题，尤其适用于基础教育中的多步骤推理训练。此外，数据集支持教师培训工具的构建，让教育工作者练习脚手架教学技巧，提升教学效率与学生的学习参与度。

衍生相关工作

MATHDIAL数据集衍生了一系列相关研究，特别是在对话辅导模型的优化与评估方面。基于该数据集，研究者开发了多种微调策略，以提升开源语言模型的辅导能力，例如使用Flan-T5等模型生成更均衡的教学回应。同时，它促进了交互式评估框架的发展，如测量学生解决成功率与教师透露答案之间的权衡，为后续教育人工智能研究提供了基准与方向。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集