five

OALL/details_migtissera__Tess-v2.5.2-Qwen2-72B

收藏
Hugging Face2024-06-18 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/OALL/details_migtissera__Tess-v2.5.2-Qwen2-72B
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是在模型`migtissera/Tess-v2.5.2-Qwen2-72B`的评估运行过程中自动创建的。数据集由136个配置组成,每个配置对应一个评估任务。数据集是从1次运行中创建的,每次运行的结果作为一个特定的分割存储在配置中,分割名称使用运行的时间戳命名。train分割始终指向最新的结果。此外,还有一个名为results的配置,存储了所有运行的聚合结果。README还提供了加载数据集的具体代码示例,并展示了最新的评估结果。

该数据集是在模型`migtissera/Tess-v2.5.2-Qwen2-72B`的评估运行过程中自动创建的。数据集由136个配置组成,每个配置对应一个评估任务。数据集是从1次运行中创建的,每次运行的结果作为一个特定的分割存储在配置中,分割名称使用运行的时间戳命名。train分割始终指向最新的结果。此外,还有一个名为results的配置,存储了所有运行的聚合结果。README还提供了加载数据集的具体代码示例,并展示了最新的评估结果。
提供机构:
OALL
原始信息汇总

数据集概述

数据集基本信息

  • 名称: Evaluation run of migtissera/Tess-v2.5.2-Qwen2-72B
  • 来源: 自动创建于模型评估过程中
  • 配置数量: 136
  • 创建次数: 1次

数据集结构

  • 配置: 每个配置对应一个评估任务
  • 分割: 每个运行结果作为一个特定的分割,分割名称使用运行的时间戳
  • 训练分割: 指向最新的结果
  • 结果配置: 存储所有运行的聚合结果

数据加载示例

python from datasets import load_dataset data = load_dataset("OALL/details_migtissera__Tess-v2.5.2-Qwen2-72B", "lighteval_xstory_cloze_ar_0", split="train")

最新结果

  • 时间戳: 2024-06-18T00:28:03.369727
  • 结果: 包含多个任务的评估结果,具体结果如下:

任务结果示例

  • 任务: community|acva:Algeria|0

    • acc_norm: 0.5384615384615384
    • acc_norm_stderr: 0.03579154352544571
  • 任务: community|acva:Ancient_Egypt|0

    • acc_norm: 0.05714285714285714
    • acc_norm_stderr: 0.013099028872013169
  • 任务: community|acva:Arab_Empire|0

    • acc_norm: 0.30943396226415093
    • acc_norm_stderr: 0.028450154794118627
  • 任务: community|acva:Arabic_Architecture|0

    • acc_norm: 0.49743589743589745
    • acc_norm_stderr: 0.03589743589743589
  • 任务: community|acva:Arabic_Art|0

    • acc_norm: 0.3641025641025641
    • acc_norm_stderr: 0.03454653867786389
  • 任务: community|acva:Arabic_Astronomy|0

    • acc_norm: 0.4666666666666667
    • acc_norm_stderr: 0.03581804596782233
  • 任务: community|acva:Arabic_Calligraphy|0

    • acc_norm: 0.47843137254901963
    • acc_norm_stderr: 0.0313435870640056
  • 任务: community|acva:Arabic_Ceremony|0

    • acc_norm: 0.518918918918919
    • acc_norm_stderr: 0.036834092970087065
  • 任务: community|acva:Arabic_Clothing|0

    • acc_norm: 0.4666666666666667
    • acc_norm_stderr: 0.03581804596782233
  • 任务: community|acva:Arabic_Culture|0

    • acc_norm: 0.38974358974358975
    • acc_norm_stderr: 0.03501424776256371
  • 任务: community|acva:Arabic_Food|0

    • acc_norm: 0.5025641025641026
    • acc_norm_stderr: 0.03589743589743588
  • 任务: community|acva:Arabic_Funeral|0

    • acc_norm: 0.4105263157894737
    • acc_norm_stderr: 0.05073863564551211
  • 任务: community|acva:Arabic_Geography|0

    • acc_norm: 0.6068965517241379
    • acc_norm_stderr: 0.040703290137070705
  • 任务: community|acva:Arabic_History|0

    • acc_norm: 0.3128205128205128
    • acc_norm_stderr: 0.033287550657248546
  • 任务: community|acva:Arabic_Language_Origin|0

    • acc_norm: 0.5894736842105263
    • acc_norm_stderr: 0.050738635645512085
  • 任务: community|acva:Arabic_Literature|0

    • acc_norm: 0.4689655172413793
    • acc_norm_stderr: 0.04158632762097828
  • 任务: community|acva:Arabic_Math|0

    • acc_norm: 0.3333333333333333
    • acc_norm_stderr: 0.03384487217112063
  • 任务: community|acva:Arabic_Medicine|0

    • acc_norm: 0.5103448275862069
    • acc_norm_stderr: 0.04165774775728763
  • 任务: community|acva:Arabic_Music|0

    • acc_norm: 0.23741007194244604
    • acc_norm_stderr: 0.036220593237998276
  • 任务: community|acva:Arabic_Ornament|0

    • acc_norm: 0.4717948717948718
    • acc_norm_stderr: 0.035840746749208334
  • 任务: community|acva:Arabic_Philosophy|0

    • acc_norm: 0.5793103448275863
    • acc_norm_stderr: 0.0411391498118926
  • 任务: community|acva:Arabic_Physics_and_Chemistry|0

    • acc_norm: 0.5743589743589743
    • acc_norm_stderr: 0.03549871080367707
  • 任务: community|acva:Arabic_Wedding|0

    • acc_norm: 0.4358974358974359
    • acc_norm_stderr: 0.035601666623466345
  • 任务: community|acva:Bahrain|0

    • acc_norm: 0.35555555555555557
    • acc_norm_stderr: 0.07216392363431012
  • 任务: community|acva:Comoros|0

    • acc_norm: 0.37777777777777777
    • acc_norm_stderr: 0.07309112127323451
  • 任务: community|acva:Egypt_modern|0

    • acc_norm: 0.3368421052631579
    • acc_norm_stderr: 0.04874810431502904
  • 任务: community|acva:InfluenceFromAncientEgypt|0

    • acc_norm: 0.6051282051282051
    • acc_norm_stderr: 0.03509545602262038
  • 任务: community|acva:InfluenceFromByzantium|0

    • acc_norm: 0.7172413793103448
    • acc_norm_stderr: 0.03752833958003337
  • 任务: community|acva:InfluenceFromChina|0

    • acc_norm: 0.26666666666666666
    • acc_norm_stderr: 0.0317493043641267
  • 任务: community|acva:InfluenceFromGreece|0

    • acc_norm: 0.6410256410256411
    • acc_norm_stderr: 0.03444042881521377
  • 任务: community|acva:InfluenceFromIslam|0

    • acc_norm: 0.4896551724137931
    • acc_norm_stderr: 0.04165774775728763
  • 任务: community|acva:InfluenceFromPersia|0

    • acc_norm: 0.7028571428571428
    • acc_norm_stderr: 0.03464507889884371
  • 任务: community|acva:InfluenceFromRome|0

    • acc_norm: 0.5846153846153846
    • acc_norm_stderr: 0.03538013280575029
  • 任务: community|acva:Iraq|0

    • acc_norm: 0.5176470588235295
    • acc_norm_stderr: 0.05452048340661895
  • 任务: community|acva:Islam_Education|0

    • acc_norm: 0.7128205128205128
    • acc_norm_stderr: 0.032483733385398866
  • 任务: community|acva:Islam_branches_and_schools|0

    • acc_norm: 0.44
    • acc_norm_stderr: 0.037630997249913416
  • 任务: community|acva:Islamic_law_system|0

    • acc_norm: 0.5794871794871795
    • acc_norm_stderr: 0.03544138389303482
  • 任务: community|acva:Jordan|0

    • acc_norm: 0.35555555555555557
    • acc_norm_stderr: 0.07216392363431012
  • 任务: community|acva:Kuwait|0

    • acc_norm: 0.26666666666666666
    • acc_norm_stderr: 0.06666666666666667
  • 任务: community|acva:Lebanon|0

    • acc_norm: 0.2
    • acc_norm_stderr: 0.06030226891555273
  • 任务: community|acva:Libya|0

    • acc_norm: 0.4444444444444444
    • acc_norm_stderr: 0.07491109582924914
  • 任务: community|acva:Mauritania|0

    • acc_norm: 0.4222222222222222
    • acc_norm_stderr: 0.07446027270295805
  • 任务: community|acva:Mesopotamia_civilization|0

    • acc_norm: 0.5225806451612903
    • acc_norm_stderr: 0.0402500394824441
  • 任务: community|acva:Morocco|0

    • acc_norm: 0.24444444444444444
    • acc_norm_stderr: 0.06478835438717
  • 任务: community|acva:Oman|0

    • acc_norm: 0.26666666666666666
    • acc_norm_stderr: 0.06666666666666665
  • 任务: community|acva:Palestine|0

    • acc_norm: 0.3058823529411765
    • acc_norm_stderr: 0.05027523520585574
  • 任务: community|acva:Qatar|0

    • acc_norm: 0.4444444444444444
    • acc_norm_stderr: 0.07491109582924914
  • 任务: community|acva:Saudi_Arabia|0

    • acc_norm: 0.39487179487179486
    • acc_norm_stderr: 0.03509545602262039
  • 任务: community|acva:Somalia|0

    • acc_norm: 0.4
    • acc_norm_stderr: 0.07385489458759965
  • 任务: community|acva:Sudan|0

    • acc_norm: 0.4222222222222222
    • acc_norm_stderr: 0.07446027270295806
  • 任务: community|acva:Syria|0

    • acc_norm: 0.3333333333333333
    • acc_norm_stderr: 0.07106690545187012
  • 任务: community|acva:Tunisia|0

    • acc_norm: 0.3111111111111111
    • acc_norm_stderr: 0.0697920592732
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作