five

Ape210K

收藏
OpenDataLab2026-04-12 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Ape210K
下载链接
链接失效反馈
资源简介:
Ape210K是一个新的大规模和模板丰富的数学单词问题数据集,包含 210K 个中国小学水平的数学问题,是最大的公共数据集 Math23K 的 9 倍(Wang et al., 2017)。每个问题都包含黄金答案和得出答案所需的方程式。Ape210K 也具有更大的多样性,有 56K 个模板,是 Math23K 的 25 倍。我们的分析表明,解决 Ape210K 不仅需要自然语言理解,还需要常识知识。

Ape210K is a novel large-scale and template-rich mathematical word problem dataset. It contains 210K Chinese primary school-level math word problems, 9 times the size of the largest public dataset Math23K (Wang et al., 2017). Each problem includes a gold answer and the mathematical equation required to derive the answer. Ape210K also features greater diversity, with 56K templates, 25 times that of Math23K. Our analysis shows that solving Ape210K requires not only natural language understanding but also common sense knowledge.
提供机构:
OpenDataLab
创建时间:
2024-05-08
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Ape210K是一个大规模、模板丰富的数学单词问题数据集,包含21万个中国小学水平的数学问题,每个问题都配有黄金答案和方程式。该数据集具有高度多样性,拥有5.6万个模板,是Math23K数据集的25倍,解决这些问题不仅需要自然语言理解,还依赖常识知识。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作