five

hmmt_feb_2025

收藏
魔搭社区2026-05-23 更新2026-05-03 收录
下载链接:
https://modelscope.cn/datasets/evalscope/hmmt_feb_2025
下载链接
链接失效反馈
官方服务:
资源简介:
### Homepage and repository - **Homepage:** [https://matharena.ai/](https://matharena.ai/) - **Repository:** [https://github.com/eth-sri/matharena](https://github.com/eth-sri/matharena) ### Dataset Summary This dataset contains the questions from HMMT February 2025 used for the MathArena Leaderboard ### Data Fields The dataset contains the following fields: - `problem_idx` (`int64`): Problem index within the corresponding MathArena benchmark. - `problem` (`string`): Problem statement, usually stored as LaTeX source. - `answer` (`string`): Gold final answer. - `problem_type` (`list[string]`): Problem type/category labels. ### Source Data The original questions were sourced from the HMMT February 2025 competition. Questions were extracted, converted to LaTeX and verified. ### Licensing Information This dataset is licensed under the Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0). Please abide by the license when using the provided data. ### Citation Information ``` @article{dekoninck2026matharena, title={Beyond Benchmarks: MathArena as an Evaluation Platform for Mathematics with LLMs}, author={Jasper Dekoninck and Nikola Jovanović and Tim Gehrunger and Kári Rögnvaldsson and Ivo Petrov and Chenhao Sun and Martin Vechev}, year={2026}, eprint={2605.00674}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2605.00674}, } ```

### 主页与代码仓库 - **主页:** [https://matharena.ai/](https://matharena.ai/) - **代码仓库:** [https://github.com/eth-sri/matharena](https://github.com/eth-sri/matharena) ### 数据集概述 本数据集收录了用于MathArena排行榜的2025年2月哈佛大学-麻省理工学院数学竞赛(Harvard-MIT Math Tournament,简称HMMT)试题。 ### 数据字段 下文将对数据集中的每个字段进行详细说明: - `problem_idx`(整数型):赛题在竞赛中的索引编号 - `problem`(字符串型):完整赛题题干 - `answer`(字符串型):该问题的标准答案(真值答案) - `problem_type`(字符串序列):赛题所属类型,可选值为「组合数学」、「数论」、「代数」、「几何」,一道赛题可同时归属多个类型。 ### 源数据说明 本数据集的原始试题源自2025年2月哈佛大学-麻省理工学院数学竞赛(Harvard-MIT Math Tournament,简称HMMT),所有试题均经过提取、LaTeX格式转换与校验流程。 ### 授权协议说明 本数据集采用知识共享署名-非商业性使用-相同方式共享4.0国际许可协议(Attribution-NonCommercial-ShareAlike 4.0 International,CC BY-NC-SA 4.0)进行授权,使用本数据集时请遵守该协议条款。 ### 引用信息 @misc{balunovic_srimatharena_2025, title = {MathArena: Evaluating LLMs on Uncontaminated Math Competitions}, author = {Mislav Balunović and Jasper Dekoninck and Ivo Petrov and Nikola Jovanović and Martin Vechev}, copyright = {MIT}, url = {https://matharena.ai/}, publisher = {SRI Lab, ETH Zurich}, month = feb, year = {2025}, }
提供机构:
maas
创建时间:
2026-01-19
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作