Multilingual Grade School Math (MGSM)
收藏MGSM-Rev2 数据集概述
数据集简介
MGSM-Rev2是Multilingual Grade School Math(MGSM)基准的修订版本,原始版本在论文《Language models are multilingual chain-of-thought reasoners》中提出。该修订版本通过纠正错误(主要是但不限于翻译不准确)改进了基线数据集。验证步骤确认修订后的问题仍可由当前大型语言模型解决。
语言覆盖
基准保持原始结构,包含250个问题,翻译为以下10种语言:
- 西班牙语
- 法语
- 德语
- 俄语
- 中文
- 日语
- 泰语
- 斯瓦希里语
- 孟加拉语
- 泰卢固语
数据格式
数据以TSV(制表符分隔值)文件格式提供,结构如下:
- 第1列:问题
- 第2列:答案
该数据格式与原MGSM数据集(https://huggingface.co/datasets/juletxara/mgsm)相同,可直接替代使用。
元数据
MGSM-Rev2/replaced_questions.json文件包含每种语言从原始数据集中替换的问题记录。注意:问题编号使用基于1的索引。
许可证
本数据集根据CC BY-SA 4.0(知识共享署名-相同方式共享4.0国际)许可证发布。
引用信息
bibtex @misc{peter2025mindgapnottranslation, title={Mind the Gap... or Not? How Translation Errors and Evaluation Details Skew Multilingual Results}, author={Jan-Thorsten Peter and David Vilar and Tobias Domhan and Dan Malkin and Markus Freitag}, year={2025}, eprint={2511.05162}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2511.05162}, }
@misc{shi2022languagemodelsmultilingualchainofthought, title={Language Models are Multilingual Chain-of-Thought Reasoners}, author={Freda Shi and Mirac Suzgun and Markus Freitag and Xuezhi Wang and Suraj Srivats and Soroush Vosoughi and Hyung Won Chung and Yi Tay and Sebastian Ruder and Denny Zhou and Dipanjan Das and Jason Wei}, year={2022}, eprint={2210.03057}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2210.03057}, }
@misc{cobbe2021trainingverifierssolvemath, title={Training Verifiers to Solve Math Word Problems}, author={Karl Cobbe and Vineet Kosaraju and Mohammad Bavarian and Mark Chen and Heewoo Jun and Lukasz Kaiser and Matthias Plappert and Jerry Tworek and Jacob Hilton and Reiichiro Nakano and Christopher Hesse and John Schulman}, year={2021}, eprint={2110.14168}, archivePrefix={arXiv}, primaryClass={cs.LG}, url={https://arxiv.org/abs/2110.14168}, }




