five

OpenEvals/leaderboard-data

收藏
Hugging Face2026-03-28 更新2026-04-05 收录
下载链接:
https://hf-mirror.com/datasets/OpenEvals/leaderboard-data
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: mit private: true configs: - config_name: default data_files: - split: train path: data/train-* dataset_info: features: - name: model_id dtype: string - name: model_name dtype: string - name: provider dtype: string - name: model_type dtype: string - name: parameters_billions dtype: float64 - name: license dtype: string - name: context_window dtype: int64 - name: modality dtype: string - name: architecture dtype: string - name: aime2026_score dtype: float64 - name: evasionBench_score dtype: float64 - name: gpqa_score dtype: float64 - name: gsm8k_score dtype: float64 - name: hle_score dtype: float64 - name: hmmt2026_score dtype: float64 - name: mmluPro_score dtype: float64 - name: olmOcr_score dtype: float64 - name: swePro_score dtype: float64 - name: sweVerified_score dtype: float64 - name: terminalBench_score dtype: float64 - name: aggregate_score dtype: float64 - name: coverage_count dtype: int64 - name: coverage_percent dtype: float64 splits: - name: train num_bytes: 25680 num_examples: 105 download_size: 17894 dataset_size: 25680 ---

许可证:MIT许可证 数据集状态:私有 配置项: - 配置名称:默认配置 数据文件: - 拆分方式:训练集 文件路径:data/train-* 数据集信息: 特征字段: - 名称:模型ID(model_id),数据类型:字符串 - 名称:模型名称(model_name),数据类型:字符串 - 名称:模型提供商(provider),数据类型:字符串 - 名称:模型类型(model_type),数据类型:字符串 - 名称:参数量(十亿)(parameters_billions),数据类型:64位浮点型 - 名称:许可证(license),数据类型:字符串 - 名称:上下文窗口大小(context_window),数据类型:64位整型 - 名称:模态(modality),数据类型:字符串 - 名称:架构(architecture),数据类型:字符串 - 名称:AIME 2026得分(aime2026_score),数据类型:64位浮点型 - 名称:EvasionBench得分(evasionBench_score),数据类型:64位浮点型 - 名称:GPQA得分(gpqa_score),数据类型:64位浮点型 - 名称:GSM8K得分(gsm8k_score),数据类型:64位浮点型 - 名称:HLE得分(hle_score),数据类型:64位浮点型 - 名称:HMMT 2026得分(hmmt2026_score),数据类型:64位浮点型 - 名称:MMLU-Pro得分(mmluPro_score),数据类型:64位浮点型 - 名称:OLM-OCR得分(olmOcr_score),数据类型:64位浮点型 - 名称:SWE-Pro得分(swePro_score),数据类型:64位浮点型 - 名称:SWE-Verified得分(sweVerified_score),数据类型:64位浮点型 - 名称:TerminalBench得分(terminalBench_score),数据类型:64位浮点型 - 名称:综合得分(aggregate_score),数据类型:64位浮点型 - 名称:覆盖计数(coverage_count),数据类型:64位整型 - 名称:覆盖占比(coverage_percent),数据类型:64位浮点型 拆分信息: - 拆分名称:训练集 占用字节数:25680 样本数量:105 下载总大小:17894 数据集总大小:25680
提供机构:
OpenEvals
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作