AIME2025-ita

Hugging Face2025-02-27 更新2025-02-28 收录

下载链接：

https://huggingface.co/datasets/fedric95/AIME2025-ita

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是AIME2025数据集的意大利语翻译版本，包含数学问题的意大利语翻译和对应的答案。数据集采用了与MathArena评估管道相同的格式，并提供了用于创建翻译的代码和推送数据到huggingface的代码。

创建时间：

2025-02-22

搜集汇总

数据集介绍

构建方式

AIME2025-ita数据集的构建过程涉及将原始的AIME2025英文数据集翻译成意大利文。翻译工作主要利用gpt-4o模型，对每个问题进行多次翻译，并从中选择最优翻译。之后，通过人工审核和修正，确保翻译质量。数据集包含训练集，其中含有30个样本，每个样本包括英文问题、意大利文翻译、问题ID及答案。

特点

AIME2025-ita数据集的特点在于，它是专门针对意大利语使用者的数学教育评估工具。数据集遵循MathArena的评价流程格式，保证了与现有评估系统的兼容性。此外，数据集在构建过程中注重翻译的准确性，尽管存在可能的翻译错误，但已通过人工审核进行了优化。

使用方法

使用AIME2025-ita数据集时，用户可以从HuggingFace平台下载。数据集以特定的格式存储，其中包含问题、翻译、ID和答案。用户可以根据自己的需求，将这些数据加载到数学评估模型中进行训练或评估。数据集提供的prompt格式有助于模型理解问题解答的步骤，并输出标准化的整数答案。

背景与挑战

背景概述

AIME2025-ita数据集是AIME2025数学竞赛题目的意大利语翻译版本，其英文参考版本由MathArena的作者创建。该数据集的构建旨在为数学教育领域提供一种评估工具，以便研究人员和开发者能够更好地理解和改进数学问题的自动评估系统。自创建以来，该数据集已在不同学术研究中得到应用，对数学教育及自然语言处理领域产生了积极影响。

当前挑战

该数据集在构建过程中遇到的挑战主要包括翻译的准确性和一致性。为确保翻译质量，创建者采用了自动化翻译工具gpt-4o，并进行了人工校对和修改。此外，数据集在解决数学问题自动评估的领域问题方面也面临挑战，如如何准确理解并评估学生的解题过程和答案。

常用场景

经典使用场景

AIME2025-ita数据集是AIME2025数学竞赛数据集的意大利语翻译版本，其经典使用场景在于为机器学习模型提供数学问题的意大利语文本及其对应的答案。该数据集通常被用于训练和评估自然语言处理模型在数学问题解答任务上的性能，如文本理解、语言翻译及问题解答等。

衍生相关工作

基于AIME2025-ita数据集，研究者可以进一步开展多语言数学问题解答模型的研究，推动多语言教育资源的开发。此外，该数据集也促进了数学问题解答相关任务的基准测试，如翻译准确性、问题理解能力等方面的评估工作。

数据集最近研究