OpenEvals/leaderboard-data
收藏Hugging Face2026-03-28 更新2026-04-05 收录
下载链接:
https://hf-mirror.com/datasets/OpenEvals/leaderboard-data
下载链接
链接失效反馈官方服务:
资源简介:
---
license: mit
private: true
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
dataset_info:
features:
- name: model_id
dtype: string
- name: model_name
dtype: string
- name: provider
dtype: string
- name: model_type
dtype: string
- name: parameters_billions
dtype: float64
- name: license
dtype: string
- name: context_window
dtype: int64
- name: modality
dtype: string
- name: architecture
dtype: string
- name: aime2026_score
dtype: float64
- name: evasionBench_score
dtype: float64
- name: gpqa_score
dtype: float64
- name: gsm8k_score
dtype: float64
- name: hle_score
dtype: float64
- name: hmmt2026_score
dtype: float64
- name: mmluPro_score
dtype: float64
- name: olmOcr_score
dtype: float64
- name: swePro_score
dtype: float64
- name: sweVerified_score
dtype: float64
- name: terminalBench_score
dtype: float64
- name: aggregate_score
dtype: float64
- name: coverage_count
dtype: int64
- name: coverage_percent
dtype: float64
splits:
- name: train
num_bytes: 25680
num_examples: 105
download_size: 17894
dataset_size: 25680
---
许可证:MIT许可证
数据集状态:私有
配置项:
- 配置名称:默认配置
数据文件:
- 拆分方式:训练集
文件路径:data/train-*
数据集信息:
特征字段:
- 名称:模型ID(model_id),数据类型:字符串
- 名称:模型名称(model_name),数据类型:字符串
- 名称:模型提供商(provider),数据类型:字符串
- 名称:模型类型(model_type),数据类型:字符串
- 名称:参数量(十亿)(parameters_billions),数据类型:64位浮点型
- 名称:许可证(license),数据类型:字符串
- 名称:上下文窗口大小(context_window),数据类型:64位整型
- 名称:模态(modality),数据类型:字符串
- 名称:架构(architecture),数据类型:字符串
- 名称:AIME 2026得分(aime2026_score),数据类型:64位浮点型
- 名称:EvasionBench得分(evasionBench_score),数据类型:64位浮点型
- 名称:GPQA得分(gpqa_score),数据类型:64位浮点型
- 名称:GSM8K得分(gsm8k_score),数据类型:64位浮点型
- 名称:HLE得分(hle_score),数据类型:64位浮点型
- 名称:HMMT 2026得分(hmmt2026_score),数据类型:64位浮点型
- 名称:MMLU-Pro得分(mmluPro_score),数据类型:64位浮点型
- 名称:OLM-OCR得分(olmOcr_score),数据类型:64位浮点型
- 名称:SWE-Pro得分(swePro_score),数据类型:64位浮点型
- 名称:SWE-Verified得分(sweVerified_score),数据类型:64位浮点型
- 名称:TerminalBench得分(terminalBench_score),数据类型:64位浮点型
- 名称:综合得分(aggregate_score),数据类型:64位浮点型
- 名称:覆盖计数(coverage_count),数据类型:64位整型
- 名称:覆盖占比(coverage_percent),数据类型:64位浮点型
拆分信息:
- 拆分名称:训练集
占用字节数:25680
样本数量:105
下载总大小:17894
数据集总大小:25680
提供机构:
OpenEvals



