Ape210K
收藏OpenDataLab2026-04-12 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Ape210K
下载链接
链接失效反馈资源简介:
Ape210K是一个新的大规模和模板丰富的数学单词问题数据集,包含 210K 个中国小学水平的数学问题,是最大的公共数据集 Math23K 的 9 倍(Wang et al., 2017)。每个问题都包含黄金答案和得出答案所需的方程式。Ape210K 也具有更大的多样性,有 56K 个模板,是 Math23K 的 25 倍。我们的分析表明,解决 Ape210K 不仅需要自然语言理解,还需要常识知识。
Ape210K is a novel large-scale and template-rich mathematical word problem dataset. It contains 210K Chinese primary school-level math word problems, 9 times the size of the largest public dataset Math23K (Wang et al., 2017). Each problem includes a gold answer and the mathematical equation required to derive the answer. Ape210K also features greater diversity, with 56K templates, 25 times that of Math23K. Our analysis shows that solving Ape210K requires not only natural language understanding but also common sense knowledge.
提供机构:
OpenDataLab
创建时间:
2024-05-08
搜集汇总
数据集介绍

背景与挑战
背景概述
Ape210K是一个大规模、模板丰富的数学单词问题数据集,包含21万个中国小学水平的数学问题,每个问题都配有黄金答案和方程式。该数据集具有高度多样性,拥有5.6万个模板,是Math23K数据集的25倍,解决这些问题不仅需要自然语言理解,还依赖常识知识。
以上内容由遇见数据集搜集并总结生成



