hmmt_feb_2023

Hugging Face2025-04-27 更新2025-04-28 收录

下载链接：

https://huggingface.co/datasets/MathArena/hmmt_feb_2023

下载链接

链接失效反馈

官方服务：

资源简介：

这个数据集包含了2023年2月HMMT数学竞赛的问题，用于MathArena排行榜。数据集中的每个问题都有问题索引、完整的问题陈述和问题的正确答案。

This dataset contains problems from the February 2023 HMMT mathematics competition, which is used for the MathArena leaderboard. Each problem in the dataset includes its problem index, full problem statement, and correct answer.

创建时间：

2025-04-25

原始信息汇总

HMMT February 2023数据集概述

数据集基本信息

名称: HMMT February 2023
语言: 英文 (en)
数据量:
- 训练集样本数: 30
- 训练集大小: 9315字节
- 下载大小: 8282字节
许可协议: 署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)
数据类别: 小规模 (n<1K)

数据字段说明

problem_idx (int64): 问题在竞赛中的索引
problem (string): 完整的问题描述
answer (string): 问题的标准答案

数据来源

原始问题来源于2023年2月举办的HMMT竞赛
问题经过提取、转换为LaTeX格式并验证

引用信息

bibtex @misc{balunovic_srimatharena_2025, title = {MathArena: Evaluating LLMs on Uncontaminated Math Competitions}, author = {Mislav Balunović and Jasper Dekoninck and Ivo Petrov and Nikola Jovanović and Martin Vechev}, copyright = {MIT}, url = {https://matharena.ai/}, publisher = {SRI Lab, ETH Zurich}, month = feb, year = {2025}, }

搜集汇总

数据集介绍

构建方式

该数据集源自2023年2月举办的哈佛-麻省理工数学锦标赛(HMMT)的竞赛题目，经过系统化整理与验证构建而成。原始题目经专业提取后转换为LaTeX格式，确保数学符号与公式的精确呈现。每个问题均标注唯一索引编号，并与标准答案严格匹配，形成结构化数据。数据集构建过程注重学术严谨性，通过多轮校验保证题目与答案的准确性，为数学竞赛研究提供了可靠的基准素材。

特点

作为专业数学竞赛数据集，其核心价值体现在三个方面：题目涵盖代数、几何、组合数学等典型竞赛领域，具有较高的专业性与挑战性；所有问题均保留原始竞赛的完整表述，包括复杂数学符号与多步推理要求；数据采用标准化字段存储，包含问题索引、完整题干和权威答案，便于机器学习模型进行端到端训练与评估。这种结构化的专业题库为数学推理能力测试提供了理想基准。

使用方法

研究者可通过HuggingFace平台直接加载数据集，默认配置包含30个训练样本。每个数据实例包含problem_idx、problem和answer三个关键字段，分别对应题目编号、LaTeX格式的数学问题及标准答案。该数据集特别适合用于大型语言模型在数学推理领域的微调与评估，建议结合交叉验证方法考察模型对竞赛级数学问题的解决能力。使用时需遵守CC BY-NC-SA 4.0许可协议，确保符合非商业用途要求。

背景与挑战

背景概述

HMMT February 2023数据集由苏黎世联邦理工学院SRI实验室的研究团队于2025年构建，旨在为大型语言模型在数学竞赛领域的评估提供基准。该数据集源自哈佛-麻省理工数学锦标赛（HMMT）2023年2月的竞赛题目，包含30道经过LaTeX格式转换和验证的数学问题及其标准答案。作为MathArena项目的重要组成部分，该数据集填补了数学竞赛领域高质量评估数据的空白，为研究者测试模型在复杂数学推理和问题解决能力方面提供了可靠工具。

当前挑战

该数据集面临的核心挑战体现在两个维度：在领域问题层面，数学竞赛题目往往融合多步骤推理、抽象概念理解和创造性解题策略，这对语言模型的数学符号处理、逻辑连贯性及知识整合能力提出极高要求；在构建过程中，原始竞赛题目的格式标准化、数学符号的精确转换以及答案的权威性验证构成主要技术难点，研究团队需确保LaTeX渲染的准确性与问题表述的完整性，同时维持竞赛题目特有的思维密度和严谨性。

常用场景

经典使用场景

在数学竞赛与教育研究领域，hmmt_feb_2023数据集为研究者提供了宝贵的资源，用于分析数学问题的结构与解题策略。该数据集收录了HMMT February 2023竞赛中的题目及其标准答案，特别适合用于训练和评估数学问题求解模型。通过该数据集，研究者可以深入探讨数学问题的难度分布、解题模式以及语言表达特点，为数学教育和技术开发提供科学依据。

实际应用

该数据集在实际应用中具有广泛潜力，尤其是在数学教育技术领域。教育机构可以利用该数据集开发智能辅导系统，帮助学生提升数学解题能力。此外，该数据集还可用于构建数学竞赛的自动化评分系统，提高竞赛评分的效率与准确性。其应用场景覆盖了从基础教育到高等竞赛的多个层面。

衍生相关工作

hmmt_feb_2023数据集催生了一系列相关研究，尤其是在数学问题求解与语言模型领域。基于该数据集，研究者开发了多种数学问题求解模型，如MathArena项目中的评估框架。这些工作不仅推动了数学智能技术的发展，还为数学教育工具的改进提供了新的思路与方法。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集