leaderboard-data
收藏Hugging Face2026-03-20 更新2026-03-21 收录
下载链接:
https://huggingface.co/datasets/OpenEvals/leaderboard-data
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个模型的相关信息,旨在提供关于不同模型性能的综合视图。数据集包含以下字段:模型ID、模型名称、提供商、模型类型、参数规模(十亿级)、许可证、上下文窗口、模态、架构,以及在多个基准测试(如AIME2026、EvasionBench、GPQA、GSM8K、HLE、HMMT2026、MMLUPro、OLMOCR、SWEPro、SWEVerified、TerminalBench)上的得分。此外,还包括聚合得分、覆盖计数和覆盖百分比等综合指标。数据集包含86个样本,总大小为20,813字节,采用MIT许可证发布。
创建时间:
2026-03-17



