five

alvarobartt/mmlu-okapi-eval-es

收藏
Hugging Face2024-02-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/alvarobartt/mmlu-okapi-eval-es
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个主题的多项选择题和问答任务,涵盖抽象代数、解剖学、天文学、商业伦理、临床知识等多个领域。每个主题的配置都包含英文和西班牙文的问题、选项和答案。数据集的任务类别包括多项选择题和问答任务,适用于多语言环境。数据集的规模在10K到100K之间,且每个配置都有开发集、验证集和测试集的分割。

该数据集包含多个主题的多项选择题和问答任务,涵盖抽象代数、解剖学、天文学、商业伦理、临床知识等多个领域。每个主题的配置都包含英文和西班牙文的问题、选项和答案。数据集的任务类别包括多项选择题和问答任务,适用于多语言环境。数据集的规模在10K到100K之间,且每个配置都有开发集、验证集和测试集的分割。
提供机构:
alvarobartt
原始信息汇总

数据集概述

基本信息

  • 语言: 西班牙语 (es)
  • 许可证: CC BY-NC 4.0
  • 数据量: 10K < n < 100K
  • 任务类别: 多选题 (multiple-choice) 和 问答 (question-answering)
  • 任务ID: 多选题问答 (multiple-choice-qa) 和 开放领域问答 (open-domain-qa)
  • 标签: chatgpt-translated

数据集配置详情

抽象代数 (abstract_algebra)

  • 特征:
    • en_question: 字符串
    • es_question: 字符串
    • en_choices: 字符串序列
    • es_choices: 字符串序列
    • en_answer: 整数 (int64)
    • es_answer: 整数 (int64)
  • 分割:
    • dev: 1760 字节, 5 个样本
    • validation: 4246 字节, 11 个样本
    • test: 40783 字节, 100 个样本
  • 下载大小: 31838 字节
  • 数据集大小: 46789 字节

解剖学 (anatomy)

  • 特征:
    • en_question: 字符串
    • es_question: 字符串
    • en_choices: 字符串序列
    • es_choices: 字符串序列
    • en_answer: 整数 (int64)
    • es_answer: 整数 (int64)
  • 分割:
    • dev: 2024 字节, 5 个样本
    • validation: 6533 字节, 14 个样本
    • test: 68781 字节, 134 个样本
  • 下载大小: 55543 字节
  • 数据集大小: 77338 字节

天文学 (astronomy)

  • 特征:
    • en_question: 字符串
    • es_question: 字符串
    • en_choices: 字符串序列
    • es_choices: 字符串序列
    • en_answer: 整数 (int64)
    • es_answer: 整数 (int64)
  • 分割:
    • dev: 4476 字节, 5 个样本
    • validation: 10713 字节, 16 个样本
    • test: 100179 字节, 152 个样本
  • 下载大小: 78498 字节
  • 数据集大小: 115368 字节

商业伦理 (business_ethics)

  • 特征:
    • en_question: 字符串
    • es_question: 字符串
    • en_choices: 字符串序列
    • es_choices: 字符串序列
    • en_answer: 整数 (int64)
    • es_answer: 整数 (int64)
  • 分割:
    • dev: 4608 字节, 5 个样本
    • validation: 6415 字节, 11 个样本
    • test: 69628 字节, 98 个样本
  • 下载大小: 62408 字节
  • 数据集大小: 80651 字节

临床知识 (clinical_knowledge)

  • 特征:
    • en_question: 字符串
    • es_question: 字符串
    • en_choices: 字符串序列
    • es_choices: 字符串序列
    • en_answer: 整数 (int64)
    • es_answer: 整数 (int64)
  • 分割:
    • dev: 2594 字节, 5 个样本
    • validation: 14438 字节, 29 个样本
    • test: 135086 字节, 263 个样本
  • 下载大小: 103601 字节
  • 数据集大小: 152118 字节

大学生物学 (college_biology)

  • 特征:
    • en_question: 字符串
    • es_question: 字符串
    • en_choices: 字符串序列
    • es_choices: 字符串序列
    • en_answer: 整数 (int64)
    • es_answer: 整数 (int64)
  • 分割:
    • dev: 3177 字节, 5 个样本
    • validation: 10330 字节, 16 个样本
    • test: 103413 字节, 143 个样本
  • 下载大小: 87080 字节
  • 数据集大小: 116920 字节

大学化学 (college_chemistry)

  • 特征:
    • en_question: 字符串
    • es_question: 字符串
    • en_choices: 字符串序列
    • es_choices: 字符串序列
    • en_answer: 整数 (int64)
    • es_answer: 整数 (int64)
  • 分割:
    • dev: 2779 字节, 5 个样本
    • validation: 4874 字节, 8 个样本
    • test: 52123 字节, 100 个样本
  • 下载大小: 51328 字节
  • 数据集大小: 59776 字节

大学计算机科学 (college_computer_science)

  • 特征:
    • en_question: 字符串
    • es_question: 字符串
    • en_choices: 字符串序列
    • es_choices: 字符串序列
    • en_answer: 整数 (int64)
    • es_answer: 整数 (int64)
  • 分割:
    • dev: 5805 字节, 5 个样本
    • validation: 9920 字节, 11 个样本
    • test: 89185 字节, 98 个样本
  • 下载大小: 82341 字节
  • 数据集大小: 104910 字节

大学数学 (college_mathematics)

  • 特征:
    • en_question: 字符串
    • es_question: 字符串
    • en_choices: 字符串序列
    • es_choices: 字符串序列
    • en_answer: 整数 (int64)
    • es_answer: 整数 (int64)
  • 分割:
    • dev: 3089 字节, 5 个样本
    • validation: 5484 字节, 11 个样本
    • test: 50044 字节, 97 个样本
  • 下载大小: 51658 字节
  • 数据集大小: 58617 字节

大学医学 (college_medicine)

  • 特征:
    • en_question: 字符串
    • es_question: 字符串
    • en_choices: 字符串序列
    • es_choices: 字符串序列
    • en_answer: 整数 (int64)
    • es_answer: 整数 (int64)
  • 分割:
    • dev: 3649 字节, 5 个样本
    • validation: 16728 字节, 22 个样本
    • test: 171553 字节, 171 个样本
  • 下载大小: 115167 字节
  • 数据集大小: 191930 字节

大学物理 (college_physics)

  • 特征:
    • en_question: 字符串
    • es_question: 字符串
    • en_choices: 字符串序列
    • es_choices: 字符串序列
    • en_answer: 整数 (int64)
    • es_answer: 整数 (int64)
  • 分割:
    • dev: 2898 字节, 5 个样本
    • validation: 7335 字节, 11 个样本
    • test: 62094 字节, 100 个样本
  • 下载大小: 57235 字节
  • 数据集大小: 72327 字节

计算机安全 (computer_security)

  • 特征:
    • en_question: 字符串
    • es_question: 字符串
    • en_choices: 字符串序列
    • es_choices: 字符串序列
    • en_answer: 整数 (int64)
    • es_answer: 整数 (int64)
  • 分割:
    • dev: 1733 字节, 4 个样本
    • validation: 9678 字节, 11 个样本
    • test: 58507 字节, 100 个样本
  • 下载大小: 57512 字节
  • 数据集大小: 69918 字节

概念物理 (conceptual_physics)

  • 特征:
    • en_question: 字符串
    • es_question: 字符串
    • en_choices: 字符串序列
    • es_choices: 字符串序列
    • en_answer: 整数 (int64)
    • es_answer: 整数 (int64)
  • 分割:
    • dev: 1965 字节, 5 个样本
    • validation: 9503 字节, 26 个样本
    • test: 86744 字节, 235 个样本
  • 下载大小: 69227 字节
  • 数据集大小: 98212 字节

计量经济学 (econometrics)

  • 特征:
    • en_question: 字符串
    • es_question: 字符串
    • en_choices: 字符串序列
    • es_choices: 字符串序列
    • en_answer: 整数 (int64)
    • es_answer: 整数 (int64)
  • 分割:
    • dev: 3459 字节, 5 个样本
    • validation: 10475 字节, 12 个样本
    • test: 94779 字节, 110 个样本
  • 下载大小: 71152 字节
  • 数据集大小: 108713 字节

电气工程 (electrical_engineering)

  • 特征:
    • en_question: 字符串
    • es_question: 字符串
    • en_choices: 字符串序列
    • es_choices: 字符串序列
    • en_answer: 整数 (int64)
    • es_answer: 整数 (int64)
  • 分割:
    • dev: 2046 字节, 5 个样本
    • validation: 6173 字节, 16 个样本
    • test: 54302 字节, 145 个样本
  • 下载大小: 51393 字节
  • 数据集大小: 62521 字节

初等数学 (elementary_mathematics)

  • 特征:
    • en_question: 字符串
    • es_question: 字符串
    • en_choices: 字符串序列
    • es_choices: 字符串序列
    • en_answer: 整数 (int64)
    • es_answer: 整数 (int64)
  • 分割:
    • dev: 2726 字节, 4 个样本
    • validation: 18444 字节, 40 个样本
    • test: 144531 字节, 369 个样本
  • 下载大小: 109491 字节
  • 数据集大小: 165701 字节

形式逻辑 (formal_logic)

  • 特征:
    • en_question: 字符串
    • es_question: 字符串
    • en_choices: 字符串序列
    • es_choices: 字符串序列
    • en_answer: 整数 (int64)
    • es_answer: 整数 (int64)
  • 分割:
    • dev: 3619 字节, 5 个样本
    • validation: 12939 字节, 14 个样本
    • test: 96569 字节, 118 个样本
  • 下载大小: 63090 字节
  • 数据集大小: 113127 字节

全球事实 (global_facts)

  • 特征:
    • en_question: 字符串
    • es_question: 字符串
    • en_choices: 字符串序列
    • es_choices: 字符串序列
    • en_answer: 整数 (int64)
    • es_answer: 整数 (int64)
  • 分割:
    • dev: 2553 字节, 5 个样本
    • validation: 3941 字节, 10 个样本
    • test: 39400 字节, 100 个样本
  • 下载大小: 37322 字节
  • 数据集大小: 45894 字节

高中生物学 (high_school_biology)

  • 特征:
    • en_question: 字符串
    • es_question: 字符串
    • en_choices: 字符串序列
    • es_choices: 字符串序列
    • en_answer: 整数 (int64)
    • es_answer: 整数 (int64)
  • 分割:
    • dev: 3476 字节, 5 个样本
    • validation: 23395 字节, 32 个样本
    • test: 232885 字节, 309 个样本
  • 下载大小: 158998 字节
  • 数据集大小: 259756 字节

高中化学 (high_school_chemistry)

  • 特征:
    • en_question: 字符串
    • es_question: 字符串
    • en_choices: 字符串序列
    • es_choices: 字符串序列
    • en_answer: 整数 (int64)
    • es_answer: 整数 (int64)
  • 分割:
    • dev: 2507 字节, 5 个样本
    • validation: 14839 字节, 22 个样本
    • test: 120079 字
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作