OALL/details_mssqpi__ALQLora2
收藏Hugging Face2024-07-18 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/OALL/details_mssqpi__ALQLora2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是在模型mssqpi/ALQLora2的评估运行期间自动创建的。数据集由136个配置组成,每个配置对应于一个评估任务。数据集是从1次运行中创建的,每次运行在每个配置中表示为特定的拆分,拆分名称使用运行的时间戳。train拆分始终指向最新的结果。此外,还有一个名为results的配置,存储了所有运行的聚合结果。README还提供了如何使用Python中的datasets库加载数据集的示例,并包含了特定运行的最新结果。
The dataset is automatically created during the evaluation run of the model mssqpi/ALQLora2. It consists of 136 configurations, each corresponding to a specific evaluated task. The dataset was generated from one run, with each run represented as a specific split named using the timestamp of the run. The train split always points to the latest results. An additional configuration results stores all the aggregated results of the run. The dataset includes detailed results from various tasks, with accuracy metrics and standard errors provided for each task.
提供机构:
OALL
原始信息汇总
数据集概述
数据集来源
- 数据集自动创建于模型 mssqpi/ALQLora2 的评估运行过程中。
数据集结构
- 数据集包含 136 个配置,每个配置对应一个评估任务。
- 数据集从 1 次运行中创建,每次运行的详细信息存储在特定的分割中,分割名称使用运行的时间戳。
- "train" 分割始终指向最新的结果。
- 额外的 "results" 配置存储所有运行的聚合结果。
数据加载示例
python from datasets import load_dataset data = load_dataset("OALL/details_mssqpi__ALQLora2", "lighteval_xstory_cloze_ar_0", split="train")
最新结果
- 最新结果来自 2024-07-18T08:34:36.689784 运行,包含多个任务的准确率和标准误差。
- 示例结果: python { "all": { "acc_norm": 0.46723422869165016, "acc_norm_stderr": 0.03832767101434313, "acc": 0.6512243547319656, "acc_stderr": 0.012264502012981189 }, "community|acva:Algeria|0": { "acc_norm": 0.6974358974358974, "acc_norm_stderr": 0.03298070870085618 }, "community|acva:Ancient_Egypt|0": { "acc_norm": 0.2222222222222222, "acc_norm_stderr": 0.02346154912137398 }, ... }



