Ape210K
收藏Opencsg2024-05-09 更新2024-06-22 收录
下载链接:
https://www.opencsg.com/datasets/OpenDataLab/Ape210K
下载链接
链接失效反馈官方服务:
资源简介:
Ape210K是一个新的大规模和模板丰富的数学单词问题数据集,包含 210K 个中国小学水平的数学问题,是最大的公共数据集 Math23K 的 9 倍(Wang et al., 2017)。每个问题都包含黄金答案和得出答案所需的方程式。Ape210K 也具有更大的多样性,有 56K 个模板,是 Math23K 的 25 倍。我们的分析表明,解决 Ape210K 不仅需要自然语言理解,还需要常识知识。
Ape210K is a novel large-scale and template-rich mathematical word problem dataset containing 210K Chinese primary school-level math problems, which is 9 times the size of Math23K, the largest public dataset (Wang et al., 2017). Each problem includes a golden answer and the equation required to derive the answer. Ape210K also has greater diversity, with 56K templates, 25 times that of Math23K. Our analysis indicates that solving Ape210K requires not only natural language understanding but also common sense knowledge.
创建时间:
2024-05-09
搜集汇总
数据集介绍

背景与挑战
背景概述
Ape210K是一个大规模、模板丰富的数学单词问题数据集,包含21万个中国小学水平的数学问题,规模是Math23K数据集的9倍,每个问题都提供黄金答案和方程式。它具有56K个模板,多样性是Math23K的25倍,解决该数据集需要自然语言理解和常识知识,适用于文本分类等任务。
以上内容由遇见数据集搜集并总结生成



