AlgoTune
收藏AlgoTune 数据集概述
数据集基本信息
- 数据集名称: AlgoTune
- 许可证: MIT
- 相关链接:
- 官方网站: https://algotune.io/
- 论文: https://arxiv.org/abs/2507.15887
- 代码仓库: https://github.com/oripress/AlgoTune/
数据集简介
AlgoTune 是一个用于评估语言模型生成新算法能力的基准测试。它包含 154 个广泛使用的数学、物理和计算机科学函数。对于每个函数,其目标是编写代码,使其输出与原始函数相同,同时运行速度更快。
核心内容与目标
除了基准测试外,该项目还提供了一个名为 AlgoTuner 的智能体,使语言模型能够轻松地优化代码。其主要目标是探究语言模型在构思新算法方面的能力。
运行与部署
AlgoTune 现可轻松在 AWS 上运行,仅需 OpenRouter API 密钥和 AWS 凭证。关于在 SLURM 或单台机器上运行 AlgoTuner 的更多信息,请参考代码仓库。
引用信息
如需引用此工作,请使用以下 BibTeX 条目: bibtex @article{press2025algotune, title={AlgoTune: Can Language Models Speed Up General-Purpose Numerical Programs?}, author={Press, Ori and Amos, Brandon and Zhao, Haoyu and Wu, Yikai and Ainsworth, Samuel K. and Krupke, Dominik and Kidger, Patrick and Sajed, Touqir and Stellato, Bartolomeo and Park, Jisun and Bosch, Nathanael and Meril, Eli and Steppi, Albert and Zharmagambetov, Arman and Zhang, Fangzhao and Perez-Pineiro, David and Mercurio, Alberto and Zhan, Ni and Abramovich, Talor and Lieret, Kilian and Zhang, Hanlin and Huang, Shirley and Bethge, Matthias and Press, Ofir}, journal={arXiv preprint arXiv:2507.15887}, year={2025}, doi={10.48550/arXiv.2507.15887}, url={https://arxiv.org/abs/2507.15887}}




