open-llm-leaderboard-old/details_Noodlz__DolphinLake-7B|模型评估数据集|自然语言处理数据集
收藏数据集概述
数据集基本信息
- 数据集名称: Evaluation run of Noodlz/DolphinLake-7B
- 数据集来源: 自动创建于模型 Noodlz/DolphinLake-7B 在 Open LLM Leaderboard 的评估运行中。
- 数据集结构: 包含63个配置,每个配置对应一个评估任务。
- 数据集创建: 从1次运行中创建,每个运行在每个配置中作为一个特定的分割存在,分割名称使用运行的时间戳。"train" 分割始终指向最新的结果。
数据集加载示例
python from datasets import load_dataset data = load_dataset("open-llm-leaderboard/details_Noodlz__DolphinLake-7B", "harness_winogrande_5", split="train")
最新结果
- 最新结果来源: 2024-04-17T04:59:43.548335
- 结果示例: python { "all": { "acc": 0.5789236961689992, "acc_stderr": 0.03340633344924751, "acc_norm": 0.5820572394323067, "acc_norm_stderr": 0.03410336726668952, "mc1": 0.4369645042839657, "mc1_stderr": 0.017363844503195974, "mc2": 0.581720265425322, "mc2_stderr": 0.015868808242331417 }, "harness|arc:challenge|25": { "acc": 0.6450511945392492, "acc_stderr": 0.01398303690409409, "acc_norm": 0.6945392491467577, "acc_norm_stderr": 0.013460080478002512 }, ... }
配置信息
-
配置名称: harness_arc_challenge_25
- 数据文件:
- 分割: 2024_04_17T04_59_43.548335
- 路径:
**/details_harness|arc:challenge|25_2024-04-17T04-59-43.548335.parquet
- 路径:
- 分割: latest
- 路径:
**/details_harness|arc:challenge|25_2024-04-17T04-59-43.548335.parquet
- 路径:
- 分割: 2024_04_17T04_59_43.548335
- 数据文件:
-
配置名称: harness_gsm8k_5
- 数据文件:
- 分割: 2024_04_17T04_59_43.548335
- 路径:
**/details_harness|gsm8k|5_2024-04-17T04-59-43.548335.parquet
- 路径:
- 分割: latest
- 路径:
**/details_harness|gsm8k|5_2024-04-17T04-59-43.548335.parquet
- 路径:
- 分割: 2024_04_17T04_59_43.548335
- 数据文件:
-
配置名称: harness_hellaswag_10
- 数据文件:
- 分割: 2024_04_17T04_59_43.548335
- 路径:
**/details_harness|hellaswag|10_2024-04-17T04-59-43.548335.parquet
- 路径:
- 分割: latest
- 路径:
**/details_harness|hellaswag|10_2024-04-17T04-59-43.548335.parquet
- 路径:
- 分割: 2024_04_17T04_59_43.548335
- 数据文件:
-
配置名称: harness_hendrycksTest_5
- 数据文件:
- 分割: 2024_04_17T04_59_43.548335
- 路径:
**/details_harness|hendrycksTest-abstract_algebra|5_2024-04-17T04-59-43.548335.parquet**/details_harness|hendrycksTest-anatomy|5_2024-04-17T04-59-43.548335.parquet- ...
- 路径:
- 分割: latest
- 路径:
**/details_harness|hendrycksTest-abstract_algebra|5_2024-04-17T04-59-43.548335.parquet**/details_harness|hendrycksTest-anatomy|5_2024-04-17T04-59-43.548335.parquet- ...
- 路径:
- 分割: 2024_04_17T04_59_43.548335
- 数据文件:
CAMO(Camouflaged Object)
伪装对象 (CAMO) 数据集,专为伪装对象分割任务而设计。我们关注两类,即自然伪装的物体和人工伪装的物体,它们通常分别对应于现实世界中的动物和人类。 伪装对象图像由 1250 张图像组成(训练集 1000 张图像,测试集 250 张图像)。从 MS-COCO 数据集中收集非伪装对象图像(训练集 1000 张图像,测试集 250 张图像)。 CAMO 具有客观性掩码真实性。
OpenDataLab 收录
Vimeo-90K
Vimeo-90K 是用于低级视频处理的大规模高质量视频数据集。它提出了三种不同的视频处理任务:帧插值、视频去噪/去块和视频超分辨率。
OpenDataLab 收录
LFW (Labeled Faces in the Wild)
Labeled Faces in the Wild,是一个人脸照片数据库,旨在研究无约束的人脸识别问题。该数据集包含从网络收集的超过 13,000 张人脸图像。每张脸都标有图中人物的名字。照片中的 1680 人在数据集中有两张或更多张不同的照片。这些人脸的唯一限制是它们是由 Viola-Jones 人脸检测器检测到的。更多细节可以在下面的技术报告中找到。
OpenDataLab 收录
Climate Data Store (CDS)
Climate Data Store (CDS) 是一个提供气候相关数据的平台,涵盖了从历史气候数据到未来气候预测的广泛信息。数据集包括但不限于气象观测数据、再分析数据、气候模型输出、气候影响评估工具等。
cds.climate.copernicus.eu 收录
World Development Indicators (WDI)
世界发展指标(World Development Indicators, WDI)是由世界银行发布的一个综合数据集,涵盖了全球200多个国家和地区的经济、社会和环境指标。数据集包括人口统计、教育、健康、经济、环境等多个领域的指标,旨在提供全球发展状况的全面视图。
databank.worldbank.org 收录
