five

OALL/AlGhafa-Arabic-LLM-Benchmark-Native

收藏
Hugging Face2024-03-07 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/OALL/AlGhafa-Arabic-LLM-Benchmark-Native
下载链接
链接失效反馈
官方服务:
资源简介:
AlGhafa阿拉伯语LLM基准测试数据集是一个用于零样本和少样本评估阿拉伯语大语言模型的多项选择基准测试。该数据集包含多个任务,如Belebele Ar MSA、Belebele Ar Dialects、COPA Ar、Facts balanced、MCQ Exams Ar、OpenbookQA Ar、Rating sentiment、Rating sentiment no neutral、Sentiment、SOQAL和XGLUE等。每个任务都有详细的描述和来源,数据集的特征包括查询、多个解决方案和标签。数据集分为测试集和验证集,并提供了每个任务的数据量、下载大小和数据集大小。

AlGhafa阿拉伯语LLM基准测试数据集是一个用于零样本和少样本评估阿拉伯语大语言模型的多项选择基准测试。该数据集包含多个任务,如Belebele Ar MSA、Belebele Ar Dialects、COPA Ar、Facts balanced、MCQ Exams Ar、OpenbookQA Ar、Rating sentiment、Rating sentiment no neutral、Sentiment、SOQAL和XGLUE等。每个任务都有详细的描述和来源,数据集的特征包括查询、多个解决方案和标签。数据集分为测试集和验证集,并提供了每个任务的数据量、下载大小和数据集大小。
提供机构:
OALL
原始信息汇总

数据集概述

数据集配置

配置名称:mcq_exams_test_ar

  • 特征:
    • query: string
    • sol1: string
    • sol2: string
    • sol3: string
    • sol4: string
    • label: string
  • 分割:
    • test: 152003 字节, 557 样本
    • validation: 1135 字节, 5 样本
  • 下载大小: 92764 字节
  • 数据集大小: 153138 字节

配置名称:meta_ar_dialects

  • 特征:
    • query: string
    • sol1: string
    • sol2: string
    • sol3: string
    • sol4: string
    • label: string
  • 分割:
    • test: 5612859 字节, 5395 样本
    • validation: 4919 字节, 5 样本
  • 下载大小: 2174106 字节
  • 数据集大小: 5617778 字节

配置名称:meta_ar_msa

  • 特征:
    • query: string
    • sol1: string
    • sol2: string
    • sol3: string
    • sol4: string
    • label: string
  • 分割:
    • test: 948833 字节, 895 样本
    • validation: 5413 字节, 5 样本
  • 下载大小: 380941 字节
  • 数据集大小: 954246 字节

配置名称:multiple_choice_facts_truefalse_balanced_task

  • 特征:
    • query: string
    • sol1: string
    • sol2: string
    • label: string
  • 分割:
    • test: 121221 字节, 75 样本
    • validation: 7919 字节, 5 样本
  • 下载大小: 79171 字节
  • 数据集大小: 129140 字节

配置名称:multiple_choice_grounded_statement_soqal_task

  • 特征:
    • query: string
    • sol1: string
    • sol2: string
    • sol3: string
    • sol4: string
    • sol5: string
    • label: string
  • 分割:
    • test: 158002 字节, 150 样本
    • validation: 3954 字节, 5 样本
  • 下载大小: 67794 字节
  • 数据集大小: 161956 字节

配置名称:multiple_choice_grounded_statement_xglue_mlqa_task

  • 特征:
    • query: string
    • sol1: string
    • sol2: string
    • sol3: string
    • sol4: string
    • sol5: string
    • label: string
  • 分割:
    • test: 141989 字节, 150 样本
    • validation: 4082 字节, 5 样本
  • 下载大小: 83512 字节
  • 数据集大小: 146071 字节

配置名称:multiple_choice_rating_sentiment_no_neutral_task

  • 特征:
    • query: string
    • sol1: string
    • sol2: string
    • label: string
  • 分割:
    • test: 1407543 字节, 7995 样本
    • validation: 846 字节, 5 样本
  • 下载大小: 484542 字节
  • 数据集大小: 1408389 字节

配置名称:multiple_choice_rating_sentiment_task

  • 特征:
    • query: string
    • sol1: string
    • sol2: string
    • sol3: string
    • label: string
  • 分割:
    • test: 1218655 字节, 5995 样本
    • validation: 879 字节, 5 样本
  • 下载大小: 379244 字节
  • 数据集大小: 1219534 字节

配置名称:multiple_choice_sentiment_task

  • 特征:
    • query: string
    • sol1: string
    • sol2: string
    • sol3: string
    • label: string
  • 分割:
    • test: 456436 字节, 1720 样本
    • validation: 1320 字节, 5 样本
  • 下载大小: 189943 字节
  • 数据集大小: 457756 字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作