OALL/details_Danielbrdz__Barcenas-Llama3-8b-ORPO

Name: OALL/details_Danielbrdz__Barcenas-Llama3-8b-ORPO
Creator: OALL
Published: 2024-05-23 20:54:29
License: 暂无描述

Hugging Face2024-05-23 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/OALL/details_Danielbrdz__Barcenas-Llama3-8b-ORPO

下载链接

链接失效反馈

官方服务：

资源简介：

数据集 Evaluation run of Danielbrdz/Barcenas-Llama3-8b-ORPO 是在模型评估过程中自动生成的，包含136个配置，每个配置对应一个评估任务。数据集由1次运行生成，每次运行的结果作为一个特定的分割，分割名称使用运行的时间戳。train 分割始终指向最新的结果。此外，还有一个名为 results 的配置存储了所有运行的聚合结果。

提供机构：

OALL

原始信息汇总

数据集概述

数据集名称

Evaluation run of Danielbrdz/Barcenas-Llama3-8b-ORPO

数据集创建

自动创建：该数据集是在评估模型Danielbrdz/Barcenas-Llama3-8b-ORPO的过程中自动生成的。

数据集组成

配置数量：包含136个配置，每个配置对应一个评估任务。
运行次数：数据集由1次运行创建。每个运行在每个配置中作为一个特定的分割存在，分割名称使用运行的时间戳命名。
分割详情："train"分割始终指向最新的结果。
额外配置："results"配置存储了所有运行的聚合结果。

加载数据示例

python from datasets import load_dataset data = load_dataset("OALL/details_Danielbrdz__Barcenas-Llama3-8b-ORPO", "lighteval_xstory_cloze_ar_0", split="train")

数据集详细内容

结果数据结构：每个任务的结果包括归一化准确率（acc_norm）和归一化准确率标准误差（acc_norm_stderr）。
任务多样性：涵盖了从社区知识到专业学术领域的多种任务，如阿拉伯文化、历史、语言学、医学等。
性能指标：提供了每个任务的性能评估，有助于分析模型在不同领域的应用效果。

5,000+

优质数据集

54 个

任务类型

进入经典数据集