five

AIME_2024

收藏
魔搭社区2025-02-07 更新2025-01-25 收录
下载链接:
https://modelscope.cn/datasets/AI-ModelScope/AIME_2024
下载链接
链接失效反馈
官方服务:
资源简介:
# AIME 2024 Dataset ## Dataset Description This dataset contains problems from the American Invitational Mathematics Examination (AIME) 2024. AIME is a prestigious high school mathematics competition known for its challenging mathematical problems. ## Dataset Details - **Format**: JSONL - **Size**: 30 records - **Source**: AIME 2024 I & II - **Language**: English ### Data Fields Each record contains the following fields: - `ID`: Problem identifier (e.g., "2024-I-1" represents Problem 1 from 2024 Contest I) - `Problem`: Problem statement - `Solution`: Detailed solution process - `Answer`: Final numerical answer ## Purpose This dataset is primarily used for: 1. Evaluating Large Language Models' (LLMs) mathematical reasoning capabilities 2. Testing models' problem-solving abilities on complex mathematical problems 3. Researching AI performance on structured mathematical tasks ## Features - Covers various mathematical domains (geometry, algebra, number theory, etc.) - Includes detailed solution processes for each problem - All problems have specific numerical answers - High difficulty level, suitable for testing advanced reasoning capabilities - Problems require multi-step reasoning and mathematical insight ## Dataset Structure The dataset is organized in JSONL format, where each line represents a complete problem with its solution. Example: ```json { "ID": "2024-I-1", "Problem": "Problem statement...", "Solution": "Detailed solution...", "Answer": "Numerical answer" } ```

# AIME 2024 数据集 ## 数据集说明 本数据集包含2024年美国数学邀请赛(American Invitational Mathematics Examination, AIME)的试题。AIME是一项享誉盛名的高中数学竞赛,以其极具挑战性的数学试题而闻名。 ## 数据集详情 - **格式**:JSONL - **规模**:30条数据记录 - **来源**:2024年AIME I与II卷 - **语言**:英语 ### 数据字段 每条数据记录包含以下字段: - `ID`:试题标识符(例如,"2024-I-1"代表2024年I卷第1题) - `Problem`:试题题干 - `Solution`:详细解题过程 - `Answer`:最终数值答案 ## 数据集用途 本数据集主要用于以下工作: 1. 评估大语言模型(Large Language Model, LLM)的数学推理能力 2. 测试模型在复杂数学试题上的解题能力 3. 研究人工智能在结构化数学任务中的性能表现 ## 数据集特性 - 涵盖多个数学领域(几何、代数、数论等) - 包含每道试题的详细解题过程 - 所有试题均配有明确的数值答案 - 难度较高,适用于测试高级推理能力 - 试题需要多步推理与数学洞察力 ## 数据集组织结构 本数据集采用JSONL格式组织,每一行代表一道完整的试题及其解答。示例如下: json { "ID": "2024-I-1", "Problem": "Problem statement...", "Solution": "Detailed solution...", "Answer": "Numerical answer" }
提供机构:
maas
创建时间:
2025-01-22
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含2024年美国数学邀请赛(AIME)的30个数学问题,以JSONL格式存储,每条记录包括问题陈述、详细解答和数值答案。它主要用于评估大型语言模型的数学推理能力,覆盖多个数学领域,问题难度高,需要多步推理和数学洞察力,适合测试高级AI性能。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作