five

mmlu_fr|学科测试数据集|多领域知识数据集

收藏
huggingface2024-10-23 更新2024-12-12 收录
学科测试
多领域知识
下载链接:
https://huggingface.co/datasets/neuralmagic/mmlu_fr
下载链接
链接失效反馈
资源简介:
该数据集包含多个学科领域的测试数据,涵盖从高中到大学以及专业级别的各种学科,如法律、物理、心理学、数学、伦理学、计算机科学、宗教、国际法、代数、解剖学、天文学、遗传学、机器学习、管理、市场营销、地理、历史、政治、公共关系、安全研究、逻辑、全球事实、生物、化学、形式逻辑、计量经济学、社会学、哲学、商业伦理、临床知识、病毒学等。每个学科的数据文件格式为parquet,用于测试目的。
提供机构:
Neural Magic
创建时间:
2024-10-23
原始信息汇总

数据集概述

配置列表

  • config_name: professional_law

    • split: test
    • path: professional_law.parquet
  • config_name: conceptual_physics

    • split: test
    • path: conceptual_physics.parquet
  • config_name: high_school_psychology

    • split: test
    • path: high_school_psychology.parquet
  • config_name: human_aging

    • split: test
    • path: human_aging.parquet
  • config_name: elementary_mathematics

    • split: test
    • path: elementary_mathematics.parquet
  • config_name: moral_scenarios

    • split: test
    • path: moral_scenarios.parquet
  • config_name: high_school_computer_science

    • split: test
    • path: high_school_computer_science.parquet
  • config_name: world_religions

    • split: test
    • path: world_religions.parquet
  • config_name: international_law

    • split: test
    • path: international_law.parquet
  • config_name: abstract_algebra

    • split: test
    • path: abstract_algebra.parquet
  • config_name: jurisprudence

    • split: test
    • path: jurisprudence.parquet
  • config_name: human_sexuality

    • split: test
    • path: human_sexuality.parquet
  • config_name: professional_accounting

    • split: test
    • path: professional_accounting.parquet
  • config_name: professional_psychology

    • split: test
    • path: professional_psychology.parquet
  • config_name: high_school_macroeconomics

    • split: test
    • path: high_school_macroeconomics.parquet
  • config_name: high_school_mathematics

    • split: test
    • path: high_school_mathematics.parquet
  • config_name: high_school_microeconomics

    • split: test
    • path: high_school_microeconomics.parquet
  • config_name: high_school_us_history

    • split: test
    • path: high_school_us_history.parquet
  • config_name: high_school_statistics

    • split: test
    • path: high_school_statistics.parquet
  • config_name: professional_medicine

    • split: test
    • path: professional_medicine.parquet
  • config_name: prehistory

    • split: test
    • path: prehistory.parquet
  • config_name: nutrition

    • split: test
    • path: nutrition.parquet
  • config_name: anatomy

    • split: test
    • path: anatomy.parquet
  • config_name: moral_disputes

    • split: test
    • path: moral_disputes.parquet
  • config_name: astronomy

    • split: test
    • path: astronomy.parquet
  • config_name: medical_genetics

    • split: test
    • path: medical_genetics.parquet
  • config_name: miscellaneous

    • split: test
    • path: miscellaneous.parquet
  • config_name: machine_learning

    • split: test
    • path: machine_learning.parquet
  • config_name: management

    • split: test
    • path: management.parquet
  • config_name: marketing

    • split: test
    • path: marketing.parquet
  • config_name: high_school_geography

    • split: test
    • path: high_school_geography.parquet
  • config_name: high_school_european_history

    • split: test
    • path: high_school_european_history.parquet
  • config_name: high_school_government_and_politics

    • split: test
    • path: high_school_government_and_politics.parquet
  • config_name: college_mathematics

    • split: test
    • path: college_mathematics.parquet
  • config_name: public_relations

    • split: test
    • path: public_relations.parquet
  • config_name: security_studies

    • split: test
    • path: security_studies.parquet
  • config_name: logical_fallacies

    • split: test
    • path: logical_fallacies.parquet
  • config_name: global_facts

    • split: test
    • path: global_facts.parquet
  • config_name: high_school_biology

    • split: test
    • path: high_school_biology.parquet
  • config_name: high_school_chemistry

    • split: test
    • path: high_school_chemistry.parquet
  • config_name: formal_logic

    • split: test
    • path: formal_logic.parquet
  • config_name: econometrics

    • split: test
    • path: econometrics.parquet
  • config_name: high_school_world_history

    • split: test
    • path: high_school_world_history.parquet
  • config_name: sociology

    • split: test
    • path: sociology.parquet
  • config_name: college_physics

    • split: test
    • path: college_physics.parquet
  • config_name: computer_security

    • split: test
    • path: computer_security.parquet
  • config_name: electrical_engineering

    • split: test
    • path: electrical_engineering.parquet
  • config_name: philosophy

    • split: test
    • path: philosophy.parquet
  • config_name: business_ethics

    • split: test
    • path: business_ethics.parquet
  • config_name: clinical_knowledge

    • split: test
    • path: clinical_knowledge.parquet
  • config_name: college_biology

    • split: test
    • path: college_biology.parquet
  • config_name: college_chemistry

    • split: test
    • path: college_chemistry.parquet
  • config_name: high_school_physics

    • split: test
    • path: high_school_physics.parquet
  • config_name: us_foreign_policy

    • split: test
    • path: us_foreign_policy.parquet
  • config_name: virology

    • split: test
    • path: virology.parquet
  • config_name: college_computer_science

    • split: test
    • path: college_computer_science.parquet
  • config_name: college_medicine

    • split: test
    • path: college_medicine.parquet
AI搜集汇总
数据集介绍
main_image_url
构建方式
mmlu_fr数据集的构建基于多个专业领域的知识测试,涵盖了从基础学科到高级专业课程的广泛内容。每个子数据集以Parquet文件格式存储,分别对应不同的学科领域,如法律、物理、心理学、数学等。这些数据通过精心筛选和整理,确保了内容的专业性和准确性,为模型的多领域知识评估提供了坚实的基础。
特点
mmlu_fr数据集的特点在于其多样性和专业性,涵盖了57个不同的学科领域,从高中课程到大学专业课程,甚至包括一些前沿的学科如机器学习和医学遗传学。每个子数据集均以测试集的形式呈现,便于直接用于模型的评估和验证。这种多领域的覆盖使得该数据集成为评估模型跨领域知识理解和应用能力的理想工具。
使用方法
使用mmlu_fr数据集时,用户可以根据具体需求选择相应的学科领域进行测试。每个子数据集以Parquet文件格式提供,用户可以通过加载这些文件来获取测试数据。该数据集适用于评估模型在特定领域的知识掌握情况,也可用于跨领域的综合能力测试。通过分析模型在不同学科上的表现,用户可以全面了解其知识广度和深度。
背景与挑战
背景概述
mmlu_fr数据集是一个涵盖多学科领域知识的测试集,旨在评估模型在广泛主题上的理解和推理能力。该数据集由多个学科的子集构成,包括法律、物理、心理学、数学、计算机科学等,反映了跨学科知识的复杂性和多样性。其创建背景源于对通用人工智能模型在真实世界场景中应用能力的深入探索,尤其是在多领域知识融合与推理方面的表现。通过提供多样化的测试场景,mmlu_fr为研究人员提供了一个评估模型综合能力的基准工具,推动了人工智能在跨学科应用中的发展。
当前挑战
mmlu_fr数据集面临的挑战主要体现在两个方面。其一,跨学科知识的复杂性使得模型在理解和推理过程中需要具备高度的泛化能力,尤其是在处理专业性强、领域差异大的问题时,模型的表现往往难以达到预期。其二,数据集的构建过程中,如何确保各学科数据的准确性、代表性和平衡性是一个重要难题。不同学科的知识体系差异较大,数据收集与标注需要依赖领域专家的深度参与,这对数据质量和一致性提出了较高要求。此外,如何设计有效的评估指标以全面衡量模型在跨学科任务中的表现,也是该数据集面临的关键挑战之一。
常用场景
经典使用场景
mmlu_fr数据集广泛应用于多学科知识评估领域,尤其在法学、物理学、心理学、数学等专业学科中,为研究者提供了一个全面的测试平台。通过该数据集,研究者能够评估模型在不同学科中的知识掌握程度,进而优化模型的跨学科学习能力。
解决学术问题
mmlu_fr数据集有效解决了多学科知识评估中的模型泛化问题。传统模型往往在单一学科表现优异,但在跨学科任务中表现欠佳。该数据集通过涵盖广泛的学科领域,帮助研究者识别和改善模型在跨学科任务中的不足,推动了多学科知识融合的研究进展。
衍生相关工作
基于mmlu_fr数据集,研究者们开发了多种跨学科知识评估模型,如多任务学习模型和知识图谱融合模型。这些模型不仅在学术研究中取得了显著成果,还在实际应用中展现了强大的潜力。例如,某些模型已被应用于智能教育平台,显著提升了学生的学习效果和知识掌握程度。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

13_Gitovu.rar

:unav

DataCite Commons 收录

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

鸭绿江流域与水系 – 世界地理数据大百科辞条

鸭绿江流域是指鸭绿江干流和支流汇水区,地理位置为39&deg43′57″N-42&deg17′28″N,123&deg35′59″E-128&deg45′50″E。与其接壤的流域分别是辽河流域(东)、松花江流域(北)、图们江流域(北)、大同江流域(西南)等。鸭绿江流域界线在中国境内从长白山天池火山口的南壁起始,向西南经长白山脉、转向西南至千山山脉的北部,再折向南入海;在朝鲜境内,鸭绿江流域从长白山天池南坡启始向东南经过摩天岭山脉,在头流山(2309 m)转向西南方向的赴战岭山脉,在英雄里附近转向西,经狼林山(2184 m)、广城、松源,转向西南方向的狄逾岭山脉,接江南山脉的南部后至鸭绿江河口。鸭绿江流域面积65215.49 km&sup2,其中,中国境内面积32799.22 km&sup2,朝鲜境内面积32416.27 km&sup2。鸭绿江是中(国)朝(鲜)界河,它起源于长白山天池火山口的南壁,向南经惠山(朝)、折向西经临江(中)、再转向西南直向丹东(中)、新义州(朝),最后在东港(中)和多狮里(朝)附近注入黄海的西朝鲜湾。鸭绿江干流长844.98 km,有几条比较大的支流汇入,包括在朝鲜境内的虛川江、長津江、厚州川、慈城江、禿魯江、忠满江和三桥川;在中国境内的浑江、蒲石河、瑗河等。鸭绿江干流沿中朝国界线自东北向西南流经吉林省的长白朝鲜族自治县、临江市、集安市;辽宁省的桓仁满族自治县、宽甸满族自治县、丹东市和东港市;朝鲜的两江道、慈江道和平安北道。鸭绿江流域地处暖温带湿润季风气候区。年降水量800-1200 mm。流域内多山,最高海拔2745 m,河道比降比较大,达到0.0032,其中在中段可达到0.01。丰富的降水补给和较大的河床比降,使得鸭绿江流域成为亚洲单位面积水资源和水利资源最丰富的流域之一。近80年来,流域内先后建造了水丰水库(中、朝)、渭源水库(中、朝)、铁甲水库(中)、太平哨水库(中)、桓仁水库(中)、回龙山水库(中)、满丰湖水库(朝)、版平里水库(朝)、时中湖水库(朝)、狼林湖水库(朝)、长津湖水库(朝)、赴战湖水库(朝)、丰西湖水库等(朝)。数据文件包括鸭绿江干流、鸭绿江水系和鸭绿江流域地理信息系统数据文件组成。数据集以.kmz 和.shp格式存储,数据量43.8 MB(压缩为20.1 MB)。

国家对地观测科学数据中心 收录

Wind Turbine Data

该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。

www.kaggle.com 收录

Asteroids by the Minor Planet Center

包含所有已知小行星的轨道数据和观测数据。数据来源于Minor Planet Center,格式包括Fortran (.DAT)和JSON,数据集大小为81MB(压缩)和450MB(未压缩),记录数约750,000条,每日更新。

github 收录