Ape210K
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/Chenny0808/ape210k
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为Ape210K,是一个大规模的数学应用题数据集,它被划分为训练集、验证集和测试集三个子集。该数据集主要用于评估各种解决数学应用题的模型。总题量达到210,488道,其中包括200,488道用于训练,5,000道用于验证,以及5,000道用于测试。该数据集的任务是解决数学应用题。
The dataset, named Ape210K, is a large-scale mathematical word problem dataset. It is split into three subsets: training, validation, and test sets. Primarily designed to evaluate various models for solving mathematical word problems, it contains a total of 210,488 problems, including 200,488 for training, 5,000 for validation, and 5,000 for testing. The core task of this dataset is to solve mathematical word problems.
搜集汇总
数据集介绍

背景与挑战
背景概述
Ape210K是一个大规模、模板丰富的数学应用题数据集,包含210,488个问题和56,532个模板,分为训练、验证和测试集。该数据集旨在支持数学应用题的研究和模型开发,并提供了基于OpenNMT-py的基线模型,准确率达70%。
以上内容由遇见数据集搜集并总结生成



