OALL/details_Qwen__Qwen1.5-72B

Name: OALL/details_Qwen__Qwen1.5-72B
Creator: OALL
Published: 2024-05-23 23:40:44
License: 暂无描述

Hugging Face2024-05-23 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/OALL/details_Qwen__Qwen1.5-72B

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是在评估模型Qwen/Qwen1.5-72B的过程中自动生成的，包含了136个配置，每个配置对应一个评估任务。数据集由1次运行生成，每次运行的结果作为特定的分割存储，分割名称使用运行的时间戳。train分割始终指向最新的结果。此外，还有一个名为results的配置存储了所有运行的聚合结果。

提供机构：

OALL

原始信息汇总

python from datasets import load_dataset data = load_dataset("OALL/details_Qwen__Qwen1.5-72B", "lighteval_xstory_cloze_ar_0", split="train")

总体结果:
- acc_norm: 0.43448386040634224
- acc_norm_stderr: 0.03784928154923421
- acc: 0.6512243547319656
- acc_stderr: 0.012264502012981189
各任务结果: 详细结果包括多个社区和任务的准确率（acc_norm）及其标准误差（acc_norm_stderr），具体数值请参考原始数据集文件。

5,000+

优质数据集

54 个

任务类型

进入经典数据集