AIME2025-Multilingual

Hugging Face2025-03-02 更新2025-03-03 收录

下载链接：

https://huggingface.co/datasets/fedric95/AIME2025-Multilingual

下载链接

链接失效反馈

官方服务：

资源简介：

AIME2025数据集的多语言版本，包含德语、英语、意大利语、葡萄牙语、法语和西班牙语的问题和答案，适用于MathArena的评价格式。

创建时间：

2025-02-22

搜集汇总

数据集介绍

构建方式

AIME2025-Multilingual数据集是在MathArena的英文版基础上，通过自动翻译及人工校对构建而成的多语言版本数据集。该数据集涵盖了德语、英语、意大利语、葡萄牙语、法语和西班牙语六种语言。对于每种语言的构建，均采用了GPT-4o和Claude Sonnet 3.7生成翻译候选，并由GPT-4o选出最佳翻译，随后人工进行校对和必要时的修改。

特点

该数据集的特点在于其多语言性，为研究人员提供了在不同语言环境中研究数学问题解决的机会。每个语言配置都包含两个部分：aime_2025_I和aime_2025_II，每部分包含15个问题及其答案。数据集兼容MathArena的评价格式，便于使用其评估流程进行研究。

使用方法

使用该数据集时，用户可以从HuggingFace Hub直接下载所需的语言配置。数据集的结构遵循MathArena的格式，可以直接应用于MathArena的评估管道。用户在使用前应确保理解数据集的结构和评价流程，以便正确地进行数据加载和模型评估。

背景与挑战

背景概述

AIME2025-Multilingual数据集是在MathArena项目的基础上发展起来的多语言数学问题数据集。该数据集由Federico Ricciuti和Leo D'Amato等人创建，旨在为多语言数学问题解答研究提供支持。数据集包含了德语、英语、意大利语、葡萄牙语、法语和西班牙语六种语言版本，每个版本都有aime_2025_I和aime_2025_II两个数据分割，分别包含了15个数学问题和答案。该数据集的创建丰富了多语言数学问题处理领域的研究资源，对于推动该领域的发展具有重要的参考价值。

当前挑战

在构建AIME2025-Multilingual数据集的过程中，研究人员遇到了翻译准确性的挑战，尽管使用了自动翻译工具如gpt-4o和claude sonnet 3.7，并经过人工校对，但翻译错误的可能性仍然存在。此外，数据集的多语言特性也带来了在不同语言间保持问题和答案一致性以及适应不同语言特点的技术挑战。在研究领域中，如何利用该数据集有效提升数学问题解答系统的多语言能力，以及如何进一步优化数据集质量，是当前面临的两个主要挑战。

常用场景

经典使用场景

AIME2025-Multilingual数据集作为数学竞赛题目的多语言版本，其经典使用场景主要在于为不同语言背景的研究者和学生提供公平的竞赛环境，通过多语言翻译，促进数学教育资源的国际化共享。

实际应用

在实际应用中，AIME2025-Multilingual数据集可被用于开发多语言数学教育平台，为全球学生提供定制化的数学学习和练习资源，同时也可作为翻译质量评估和机器学习模型训练的重要工具。

衍生相关工作

基于该数据集，研究者可以进一步开展多语言数学教育资源的对比分析、翻译算法的改进、以及多语言数学知识图谱的构建等衍生工作，推动相关领域的学术研究和应用发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集