AIME_2024
收藏魔搭社区2025-02-07 更新2025-01-25 收录
下载链接:
https://modelscope.cn/datasets/AI-ModelScope/AIME_2024
下载链接
链接失效反馈官方服务:
资源简介:
# AIME 2024 Dataset
## Dataset Description
This dataset contains problems from the American Invitational Mathematics Examination (AIME) 2024. AIME is a prestigious high school mathematics competition known for its challenging mathematical problems.
## Dataset Details
- **Format**: JSONL
- **Size**: 30 records
- **Source**: AIME 2024 I & II
- **Language**: English
### Data Fields
Each record contains the following fields:
- `ID`: Problem identifier (e.g., "2024-I-1" represents Problem 1 from 2024 Contest I)
- `Problem`: Problem statement
- `Solution`: Detailed solution process
- `Answer`: Final numerical answer
## Purpose
This dataset is primarily used for:
1. Evaluating Large Language Models' (LLMs) mathematical reasoning capabilities
2. Testing models' problem-solving abilities on complex mathematical problems
3. Researching AI performance on structured mathematical tasks
## Features
- Covers various mathematical domains (geometry, algebra, number theory, etc.)
- Includes detailed solution processes for each problem
- All problems have specific numerical answers
- High difficulty level, suitable for testing advanced reasoning capabilities
- Problems require multi-step reasoning and mathematical insight
## Dataset Structure
The dataset is organized in JSONL format, where each line represents a complete problem with its solution. Example:
```json
{
"ID": "2024-I-1",
"Problem": "Problem statement...",
"Solution": "Detailed solution...",
"Answer": "Numerical answer"
}
```
# AIME 2024 数据集
## 数据集说明
本数据集包含2024年美国数学邀请赛(American Invitational Mathematics Examination, AIME)的试题。AIME是一项享誉盛名的高中数学竞赛,以其极具挑战性的数学试题而闻名。
## 数据集详情
- **格式**:JSONL
- **规模**:30条数据记录
- **来源**:2024年AIME I与II卷
- **语言**:英语
### 数据字段
每条数据记录包含以下字段:
- `ID`:试题标识符(例如,"2024-I-1"代表2024年I卷第1题)
- `Problem`:试题题干
- `Solution`:详细解题过程
- `Answer`:最终数值答案
## 数据集用途
本数据集主要用于以下工作:
1. 评估大语言模型(Large Language Model, LLM)的数学推理能力
2. 测试模型在复杂数学试题上的解题能力
3. 研究人工智能在结构化数学任务中的性能表现
## 数据集特性
- 涵盖多个数学领域(几何、代数、数论等)
- 包含每道试题的详细解题过程
- 所有试题均配有明确的数值答案
- 难度较高,适用于测试高级推理能力
- 试题需要多步推理与数学洞察力
## 数据集组织结构
本数据集采用JSONL格式组织,每一行代表一道完整的试题及其解答。示例如下:
json
{
"ID": "2024-I-1",
"Problem": "Problem statement...",
"Solution": "Detailed solution...",
"Answer": "Numerical answer"
}
提供机构:
maas
创建时间:
2025-01-22
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含2024年美国数学邀请赛(AIME)的30个数学问题,以JSONL格式存储,每条记录包括问题陈述、详细解答和数值答案。它主要用于评估大型语言模型的数学推理能力,覆盖多个数学领域,问题难度高,需要多步推理和数学洞察力,适合测试高级AI性能。
以上内容由遇见数据集搜集并总结生成



