GSM8K数学推理评测数据集
收藏国家基础学科公共科学数据中心2026-03-21 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=69b97aa2195d2623ac6414d5&type=1
下载链接
链接失效反馈官方服务:
资源简介:
GSM8K(Grade School Math 8K)是由OpenAI发布的大规模小学数学应用题数据集,旨在评估和提升语言模型的多步数学推理能力。该数据集包含8,500道高质量、语言多样化的小学数学应用题,由人工问题编写者创建,并经过严格的质量控制。每道题目都配有详细的自然语言解答,展示从问题到答案的完整推理过程。GSM8K数据集于2021年10月随论文《Training Verifiers to Solve Math Word Problems》一同发布,已成为评估大语言模型数学推理能力的标准基准测试之一。该数据集的设计目标是诊断当前模型的失败模式并支持相关研究,特别是在多步数学推理这一语言模型仍难以稳健执行的任务领域。
提供机构:
中山大学



