five

human_translated_arabic_mmlu

收藏
Hugging Face2024-09-16 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/MBZUAI/human_translated_arabic_mmlu
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个学科和领域的测试数据,涵盖了从高中到大学的多个学科,包括但不限于国际法、医学遗传学、计算机科学、历史、经济学、生物学、政治学、社会学、数学、物理学、化学、解剖学、宗教、天文学、管理学、市场营销、哲学、营养学等。每个学科都有一个对应的测试数据文件。
提供机构:
Mohamed Bin Zayed University of Artificial Intelligence
创建时间:
2024-09-16
原始信息汇总

数据集概述

数据集配置

国际法

  • 配置名称: international_law
  • 数据文件:
    • 分割: test
    • 路径: international_law/test.jsonl

医学遗传学

  • 配置名称: medical_genetics
  • 数据文件:
    • 分割: test
    • 路径: medical_genetics/test.jsonl

高中计算机科学

  • 配置名称: high_school_computer_science
  • 数据文件:
    • 分割: test
    • 路径: high_school_computer_science/test.jsonl

高中美国历史

  • 配置名称: high_school_us_history
  • 数据文件:
    • 分割: test
    • 路径: high_school_us_history/test.jsonl

美国外交政策

  • 配置名称: us_foreign_policy
  • 数据文件:
    • 分割: test
    • 路径: us_foreign_policy/test.jsonl

计量经济学

  • 配置名称: econometrics
  • 数据文件:
    • 分割: test
    • 路径: econometrics/test.jsonl

大学生物学

  • 配置名称: college_biology
  • 数据文件:
    • 分割: test
    • 路径: college_biology/test.jsonl

人类老龄化

  • 配置名称: human_aging
  • 数据文件:
    • 分割: test
    • 路径: human_aging/test.jsonl

高中政府与政治

  • 配置名称: high_school_government_and_politics
  • 数据文件:
    • 分割: test
    • 路径: high_school_government_and_politics/test.jsonl

道德争议

  • 配置名称: moral_disputes
  • 数据文件:
    • 分割: test
    • 路径: moral_disputes/test.jsonl

大学计算机科学

  • 配置名称: college_computer_science
  • 数据文件:
    • 分割: test
    • 路径: college_computer_science/test.jsonl

社会学

  • 配置名称: sociology
  • 数据文件:
    • 分割: test
    • 路径: sociology/test.jsonl

抽象代数

  • 配置名称: abstract_algebra
  • 数据文件:
    • 分割: test
    • 路径: abstract_algebra/test.jsonl

高中数学

  • 配置名称: high_school_mathematics
  • 数据文件:
    • 分割: test
    • 路径: high_school_mathematics/test.jsonl

人类性行为

  • 配置名称: human_sexuality
  • 数据文件:
    • 分割: test
    • 路径: human_sexuality/test.jsonl

法理学

  • 配置名称: jurisprudence
  • 数据文件:
    • 分割: test
    • 路径: jurisprudence/test.jsonl

高中地理

  • 配置名称: high_school_geography
  • 数据文件:
    • 分割: test
    • 路径: high_school_geography/test.jsonl

史前史

  • 配置名称: prehistory
  • 数据文件:
    • 分割: test
    • 路径: prehistory/test.jsonl

道德情景

  • 配置名称: moral_scenarios
  • 数据文件:
    • 分割: test
    • 路径: moral_scenarios/test.jsonl

形式逻辑

  • 配置名称: formal_logic
  • 数据文件:
    • 分割: test
    • 路径: formal_logic/test.jsonl

高中世界历史

  • 配置名称: high_school_world_history
  • 数据文件:
    • 分割: test
    • 路径: high_school_world_history/test.jsonl

概念物理

  • 配置名称: conceptual_physics
  • 数据文件:
    • 分割: test
    • 路径: conceptual_physics/test.jsonl

管理学

  • 配置名称: management
  • 数据文件:
    • 分割: test
    • 路径: management/test.jsonl

大学物理

  • 配置名称: college_physics
  • 数据文件:
    • 分割: test
    • 路径: college_physics/test.jsonl

机器学习

  • 配置名称: machine_learning
  • 数据文件:
    • 分割: test
    • 路径: machine_learning/test.jsonl

全球事实

  • 配置名称: global_facts
  • 数据文件:
    • 分割: test
    • 路径: global_facts/test.jsonl

逻辑谬误

  • 配置名称: logical_fallacies
  • 数据文件:
    • 分割: test
    • 路径: logical_fallacies/test.jsonl

电气工程

  • 配置名称: electrical_engineering
  • 数据文件:
    • 分割: test
    • 路径: electrical_engineering/test.jsonl

计算机安全

  • 配置名称: computer_security
  • 数据文件:
    • 分割: test
    • 路径: computer_security/test.jsonl

高中心理学

  • 配置名称: high_school_psychology
  • 数据文件:
    • 分割: test
    • 路径: high_school_psychology/test.jsonl

大学化学

  • 配置名称: college_chemistry
  • 数据文件:
    • 分割: test
    • 路径: college_chemistry/test.jsonl

解剖学

  • 配置名称: anatomy
  • 数据文件:
    • 分割: test
    • 路径: anatomy/test.jsonl

初等数学

  • 配置名称: elementary_mathematics
  • 数据文件:
    • 分割: test
    • 路径: elementary_mathematics/test.jsonl

大学数学

  • 配置名称: college_mathematics
  • 数据文件:
    • 分割: test
    • 路径: college_mathematics/test.jsonl

世界宗教

  • 配置名称: world_religions
  • 数据文件:
    • 分割: test
    • 路径: world_religions/test.jsonl

天文学

  • 配置名称: astronomy
  • 数据文件:
    • 分割: test
    • 路径: astronomy/test.jsonl

公共关系

  • 配置名称: public_relations
  • 数据文件:
    • 分割: test
    • 路径: public_relations/test.jsonl

安全研究

  • 配置名称: security_studies
  • 数据文件:
    • 分割: test
    • 路径: security_studies/test.jsonl

高中微观经济学

  • 配置名称: high_school_microeconomics
  • 数据文件:
    • 分割: test
    • 路径: high_school_microeconomics/test.jsonl

大学医学

  • 配置名称: college_medicine
  • 数据文件:
    • 分割: test
    • 路径: college_medicine/test.jsonl

高中物理

  • 配置名称: high_school_physics
  • 数据文件:
    • 分割: test
    • 路径: high_school_physics/test.jsonl

商业伦理

  • 配置名称: business_ethics
  • 数据文件:
    • 分割: test
    • 路径: business_ethics/test.jsonl

市场营销

  • 配置名称: marketing
  • 数据文件:
    • 分割: test
    • 路径: marketing/test.jsonl

病毒学

  • 配置名称: virology
  • 数据文件:
    • 分割: test
    • 路径: virology/test.jsonl

哲学

  • 配置名称: philosophy
  • 数据文件:
    • 分割: test
    • 路径: philosophy/test.jsonl

营养学

  • 配置名称: nutrition
  • 数据文件:
    • 分割: test
    • 路径: nutrition/test.jsonl

临床知识

  • 配置名称: clinical_knowledge
  • 数据文件:
    • 分割: test
    • 路径: clinical_knowledge/test.jsonl
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集通过人工翻译的方式,将MMLU(Massive Multitask Language Understanding)数据集中的内容转化为阿拉伯语。每个配置(config)对应一个特定的学科领域,包含问题、选项和答案三个主要特征。数据集的构建过程严格遵循多任务学习的框架,确保每个学科领域的数据独立且完整。
特点
该数据集涵盖了从抽象代数到世界宗教的57个不同学科领域,每个领域的问题均以阿拉伯语呈现,并提供了多个选项供选择。数据集的结构清晰,每个配置均包含测试集,且数据量适中,便于模型训练和评估。此外,数据集中的问题设计严谨,能够有效评估模型在跨学科任务中的表现。
使用方法
该数据集适用于多任务学习模型的训练与评估,尤其适合用于测试模型在阿拉伯语环境下的跨学科理解能力。用户可以通过加载不同的配置来获取特定领域的数据,进而进行模型训练或性能测试。数据集的使用方法简单直观,支持通过HuggingFace平台直接下载和加载,便于研究人员快速上手。
背景与挑战
背景概述
human_translated_arabic_mmlu数据集是一个涵盖多个学科领域的多选问答数据集,旨在为阿拉伯语自然语言处理任务提供高质量的基准数据。该数据集由多个学科的子集组成,包括数学、物理、化学、生物学、医学、法律、经济学等,每个子集包含若干问题和对应的选项与答案。该数据集的创建旨在解决阿拉伯语在自然语言处理领域中的资源匮乏问题,特别是在多学科知识问答任务中的应用。通过提供多样化的学科内容,该数据集为研究人员和开发者提供了一个全面的工具,用于评估和提升阿拉伯语语言模型在复杂知识推理任务中的表现。
当前挑战
human_translated_arabic_mmlu数据集面临的挑战主要体现在两个方面。首先,该数据集旨在解决阿拉伯语自然语言处理中的多学科知识问答问题,但由于阿拉伯语的复杂性和多样性,如何确保翻译的准确性和一致性成为一大难题。其次,在数据集的构建过程中,如何从不同学科领域获取高质量的问题和答案,并确保其科学性和权威性,也是一个重要的挑战。此外,数据集的规模较大,涵盖的学科范围广泛,如何有效地组织和管理这些数据,确保其在不同任务中的可用性和可扩展性,也是构建过程中需要克服的困难。
常用场景
经典使用场景
human_translated_arabic_mmlu数据集广泛应用于多领域知识评估任务中,特别是在阿拉伯语环境下的教育和技术领域。该数据集通过提供涵盖抽象代数、解剖学、天文学等多个学科的选择题,为研究人员提供了一个标准化的测试平台,用于评估模型在复杂知识领域的表现。其多学科特性使得它成为跨领域知识理解和推理的理想工具。
解决学术问题
该数据集解决了在多语言环境下知识评估的难题,尤其是在阿拉伯语这一资源相对匮乏的语言中。通过提供高质量的翻译和多样化的学科内容,研究人员能够更好地评估模型在跨语言、跨学科任务中的表现。此外,它还为自然语言处理领域中的多语言模型训练和评估提供了重要的基准数据,推动了多语言理解技术的发展。
衍生相关工作
基于human_translated_arabic_mmlu数据集,许多经典研究工作得以展开。例如,研究人员开发了针对阿拉伯语的多语言预训练模型,并在该数据集上进行了性能评估。此外,该数据集还催生了一系列关于跨语言知识迁移和跨学科推理的研究,推动了自然语言处理领域在非英语环境下的发展。这些工作不仅提升了模型的泛化能力,还为多语言技术的实际应用奠定了基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作