five

OpenEvals/IMO-AnswerBench

收藏
Hugging Face2026-01-23 更新2026-02-07 收录
下载链接:
https://hf-mirror.com/datasets/OpenEvals/IMO-AnswerBench
下载链接
链接失效反馈
官方服务:
资源简介:
IMO-AnswerBench是一个用于评估大型语言模型数学推理能力的基准数据集。它包含400个来自国际数学奥林匹克竞赛(IMO)和其他来源的具有挑战性的短答案问题。该数据集是IMO-Bench套件的一部分,由Google DeepMind在2025年获得IMO金牌成就时发布。数据集的主要任务是数学问题解决,模型需要根据问题陈述生成一个简短且可验证的答案。数据集以英语呈现,使用LaTeX格式表示数学符号。

IMO-AnswerBench is a benchmark dataset for evaluating the mathematical reasoning capabilities of large language models. It consists of 400 challenging short-answer problems from the International Mathematical Olympiad (IMO) and other sources. This dataset is part of the IMO-Bench suite, released by Google DeepMind in conjunction with their 2025 IMO gold medal achievement. The primary task for this dataset is mathematical problem solving, where a model is given a problem and must produce a short, verifiable answer. The dataset is in English and uses LaTeX for mathematical notation.
提供机构:
OpenEvals
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作