five

mmlu_hi

收藏
Hugging Face2024-10-23 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/neuralmagic/mmlu_hi
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个配置,每个配置对应一个不同的主题领域,如道德情景、公共关系、专业法律等。数据文件采用Parquet格式,并用于'测试'分割。主题涵盖了广泛的学术和专业领域,包括高中和大学级别的课程,以及医学、法律和工程等专业领域。

This dataset contains multiple configurations, each corresponding to a distinct thematic domain, such as moral scenarios, public relations, professional law, and so on. The data files are in Parquet format and are used for the 'test' split. The thematic scope covers a wide range of academic and professional fields, including high school and college-level courses, as well as professional domains such as medicine, law, and engineering.
提供机构:
Neural Magic
创建时间:
2024-10-23
原始信息汇总

数据集概述

配置信息

道德情景

  • 配置名称: moral_scenarios
  • 数据文件:
    • 分割: test
    • 路径: moral_scenarios.parquet

公共关系

  • 配置名称: public_relations
  • 数据文件:
    • 分割: test
    • 路径: public_relations.parquet

专业法律

  • 配置名称: professional_law
  • 数据文件:
    • 分割: test
    • 路径: professional_law.parquet

专业心理学

  • 配置名称: professional_psychology
  • 数据文件:
    • 分割: test
    • 路径: professional_psychology.parquet

国际法

  • 配置名称: international_law
  • 数据文件:
    • 分割: test
    • 路径: international_law.parquet

高中地理

  • 配置名称: high_school_geography
  • 数据文件:
    • 分割: test
    • 路径: high_school_geography.parquet

道德争议

  • 配置名称: moral_disputes
  • 数据文件:
    • 分割: test
    • 路径: moral_disputes.parquet

电气工程

  • 配置名称: electrical_engineering
  • 数据文件:
    • 分割: test
    • 路径: electrical_engineering.parquet

小学数学

  • 配置名称: elementary_mathematics
  • 数据文件:
    • 分割: test
    • 路径: elementary_mathematics.parquet

营养学

  • 配置名称: nutrition
  • 数据文件:
    • 分割: test
    • 路径: nutrition.parquet

高中美国历史

  • 配置名称: high_school_us_history
  • 数据文件:
    • 分割: test
    • 路径: high_school_us_history.parquet

大学医学

  • 配置名称: college_medicine
  • 数据文件:
    • 分割: test
    • 路径: college_medicine.parquet

大学物理

  • 配置名称: college_physics
  • 数据文件:
    • 分割: test
    • 路径: college_physics.parquet

高中心理学

  • 配置名称: high_school_psychology
  • 数据文件:
    • 分割: test
    • 路径: high_school_psychology.parquet

抽象代数

  • 配置名称: abstract_algebra
  • 数据文件:
    • 分割: test
    • 路径: abstract_algebra.parquet

高中世界历史

  • 配置名称: high_school_world_history
  • 数据文件:
    • 分割: test
    • 路径: high_school_world_history.parquet

专业会计

  • 配置名称: professional_accounting
  • 数据文件:
    • 分割: test
    • 路径: professional_accounting.parquet

杂项

  • 配置名称: miscellaneous
  • 数据文件:
    • 分割: test
    • 路径: miscellaneous.parquet

概念物理

  • 配置名称: conceptual_physics
  • 数据文件:
    • 分割: test
    • 路径: conceptual_physics.parquet

高中计算机科学

  • 配置名称: high_school_computer_science
  • 数据文件:
    • 分割: test
    • 路径: high_school_computer_science.parquet

安全研究

  • 配置名称: security_studies
  • 数据文件:
    • 分割: test
    • 路径: security_studies.parquet

法理学

  • 配置名称: jurisprudence
  • 数据文件:
    • 分割: test
    • 路径: jurisprudence.parquet

市场营销

  • 配置名称: marketing
  • 数据文件:
    • 分割: test
    • 路径: marketing.parquet

医学遗传学

  • 配置名称: medical_genetics
  • 数据文件:
    • 分割: test
    • 路径: medical_genetics.parquet

高中统计学

  • 配置名称: high_school_statistics
  • 数据文件:
    • 分割: test
    • 路径: high_school_statistics.parquet

解剖学

  • 配置名称: anatomy
  • 数据文件:
    • 分割: test
    • 路径: anatomy.parquet

天文学

  • 配置名称: astronomy
  • 数据文件:
    • 分割: test
    • 路径: astronomy.parquet

商业伦理

  • 配置名称: business_ethics
  • 数据文件:
    • 分割: test
    • 路径: business_ethics.parquet

高中物理

  • 配置名称: high_school_physics
  • 数据文件:
    • 分割: test
    • 路径: high_school_physics.parquet

临床知识

  • 配置名称: clinical_knowledge
  • 数据文件:
    • 分割: test
    • 路径: clinical_knowledge.parquet

社会学

  • 配置名称: sociology
  • 数据文件:
    • 分割: test
    • 路径: sociology.parquet

美国外交政策

  • 配置名称: us_foreign_policy
  • 数据文件:
    • 分割: test
    • 路径: us_foreign_policy.parquet

病毒学

  • 配置名称: virology
  • 数据文件:
    • 分割: test
    • 路径: virology.parquet

人类性学

  • 配置名称: human_sexuality
  • 数据文件:
    • 分割: test
    • 路径: human_sexuality.parquet

高中生物

  • 配置名称: high_school_biology
  • 数据文件:
    • 分割: test
    • 路径: high_school_biology.parquet

高中化学

  • 配置名称: high_school_chemistry
  • 数据文件:
    • 分割: test
    • 路径: high_school_chemistry.parquet

高中欧洲历史

  • 配置名称: high_school_european_history
  • 数据文件:
    • 分割: test
    • 路径: high_school_european_history.parquet

哲学

  • 配置名称: philosophy
  • 数据文件:
    • 分割: test
    • 路径: philosophy.parquet

史前史

  • 配置名称: prehistory
  • 数据文件:
    • 分割: test
    • 路径: prehistory.parquet

高中政府与政治

  • 配置名称: high_school_government_and_politics
  • 数据文件:
    • 分割: test
    • 路径: high_school_government_and_politics.parquet

高中宏观经济学

  • 配置名称: high_school_macroeconomics
  • 数据文件:
    • 分割: test
    • 路径: high_school_macroeconomics.parquet

人类衰老

  • 配置名称: human_aging
  • 数据文件:
    • 分割: test
    • 路径: human_aging.parquet

形式逻辑

  • 配置名称: formal_logic
  • 数据文件:
    • 分割: test
    • 路径: formal_logic.parquet

计量经济学

  • 配置名称: econometrics
  • 数据文件:
    • 分割: test
    • 路径: econometrics.parquet

世界宗教

  • 配置名称: world_religions
  • 数据文件:
    • 分割: test
    • 路径: world_religions.parquet

高中数学

  • 配置名称: high_school_mathematics
  • 数据文件:
    • 分割: test
    • 路径: high_school_mathematics.parquet

大学生物

  • 配置名称: college_biology
  • 数据文件:
    • 分割: test
    • 路径: college_biology.parquet

大学化学

  • 配置名称: college_chemistry
  • 数据文件:
    • 分割: test
    • 路径: college_chemistry.parquet

大学计算机科学

  • 配置名称: college_computer_science
  • 数据文件:
    • 分割: test
    • 路径: college_computer_science.parquet

高中微观经济学

  • 配置名称: high_school_microeconomics
  • 数据文件:
    • 分割: test
    • 路径: high_school_microeconomics.parquet

专业医学

  • 配置名称: professional_medicine
  • 数据文件:
    • 分割: test
    • 路径: professional_medicine.parquet

全球事实

  • 配置名称: global_facts
  • 数据文件:
    • 分割: test
    • 路径: global_facts.parquet

计算机安全

  • 配置名称: computer_security
  • 数据文件:
    • 分割: test
    • 路径: computer_security.parquet

大学数学

  • 配置名称: college_mathematics
  • 数据文件:
    • 分割: test
    • 路径: college_mathematics.parquet

逻辑谬误

  • 配置名称: logical_fallacies
  • 数据文件:
    • 分割: test
    • 路径: logical_fallacies.parquet

机器学习

  • 配置名称: machine_learning
  • 数据文件:
    • 分割: test
    • 路径: machine_learning.parquet

管理学

  • 配置名称: management
  • 数据文件:
    • 分割: test
    • 路径: management.parquet
搜集汇总
数据集介绍
main_image_url
构建方式
mmlu_hi数据集的构建基于多个学科领域的测试数据,涵盖了从基础学科到专业领域的广泛内容。每个学科的数据以独立的配置文件形式存储,采用Parquet格式进行高效的数据管理。数据集的构建过程注重学科多样性和内容的深度,确保每个领域的测试数据具有代表性。通过这种方式,数据集能够为多学科知识评估提供全面的支持。
特点
mmlu_hi数据集的特点在于其广泛的学科覆盖和高质量的内容设计。数据集包含了从高中到大学乃至专业领域的多个学科,如心理学、法律、物理学、计算机科学等。每个学科的数据均经过精心筛选和整理,确保其科学性和实用性。此外,数据集采用Parquet格式存储,具有高效的数据读取和处理能力,适合大规模知识评估任务。
使用方法
mmlu_hi数据集的使用方法灵活多样,适用于多学科知识评估和模型性能测试。用户可以通过加载特定的配置文件,获取相应学科的测试数据。数据集支持直接用于机器学习模型的训练和评估,尤其适合用于测试模型在跨学科知识理解上的表现。通过结合不同学科的数据,用户能够全面评估模型的知识广度和深度。
背景与挑战
背景概述
mmlu_hi数据集是一个涵盖多领域知识的多任务学习数据集,旨在评估模型在广泛学科中的理解和推理能力。该数据集由多个子任务组成,包括道德场景、公共关系、专业法律、心理学、国际法、高中地理、道德争议、电气工程、基础数学、营养学、美国历史、大学医学、大学物理、高中心理学、抽象代数、世界历史、专业会计、杂项、概念物理、高中计算机科学、安全研究、法理学、市场营销、医学遗传学、高中统计学、解剖学、天文学、商业伦理、高中物理、临床知识、社会学、美国外交政策、病毒学、人类性学、高中生物学、高中化学、欧洲历史、哲学、史前史、政府与政治、宏观经济学、人类衰老、形式逻辑、计量经济学、世界宗教、高中数学、大学生物学、大学化学、大学计算机科学、微观经济学、专业医学、全球事实、计算机安全、大学数学、逻辑谬误、机器学习和管理学等。该数据集的创建旨在为多任务学习模型提供一个全面的评估平台,推动模型在跨学科领域的应用与发展。
当前挑战
mmlu_hi数据集面临的挑战主要体现在两个方面。首先,数据集的多样性和复杂性要求模型具备跨学科的知识整合能力,这对模型的泛化能力和推理能力提出了极高的要求。其次,在数据集的构建过程中,如何确保各个子任务的数据质量和代表性是一个关键问题。不同学科的数据来源、标注标准和知识深度存在显著差异,这为数据集的统一性和一致性带来了挑战。此外,数据集的规模庞大,涉及多个领域的专业知识,如何高效地收集、整理和验证数据,确保其准确性和权威性,也是构建过程中需要克服的难题。
常用场景
经典使用场景
mmlu_hi数据集广泛应用于多领域知识评估与模型性能测试,尤其在道德场景、公共关系、专业法律和心理学等领域中,为研究者提供了丰富的测试案例。通过涵盖从基础学科到专业领域的多样化内容,该数据集能够全面评估模型在不同知识领域的表现,成为衡量模型综合能力的重要工具。
解决学术问题
mmlu_hi数据集解决了多领域知识评估中的标准化问题,为研究者提供了一个统一的测试平台。通过涵盖广泛的学科内容,该数据集能够帮助研究者识别模型在不同领域的知识盲点,推动模型在复杂场景下的性能优化。其多样化的测试案例为跨学科研究提供了宝贵的数据支持,促进了人工智能在知识密集型任务中的应用。
衍生相关工作
基于mmlu_hi数据集,研究者开发了多种跨领域知识评估模型和智能问答系统。例如,一些研究利用该数据集训练了多任务学习模型,显著提升了模型在复杂场景下的泛化能力。此外,该数据集还催生了多篇关于知识图谱构建和知识推理的研究论文,为人工智能在知识密集型任务中的应用提供了新的思路和方法。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作