five

TIGER-Lab/MMLU-STEM

收藏
Hugging Face2024-06-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/TIGER-Lab/MMLU-STEM
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了MMLU原始论文中定义的STEM学科的一个子集。包含的学科有:抽象代数, 解剖学, 天文学, 大学生物学, 大学化学, 大学计算机科学, 大学数学, 大学物理学, 计算机安全, 概念物理学, 电气工程, 初等数学, 高中生物学, 高中化学, 高中计算机科学, 高中数学, 高中物理学, 高中统计学, 机器学习。使用该数据集时请引用原始MMLU论文。

This dataset comprises a subset of the STEM disciplines as defined in the original MMLU paper. The included disciplines are: abstract algebra, anatomy, astronomy, college biology, college chemistry, college computer science, college mathematics, college physics, computer security, conceptual physics, electrical engineering, elementary mathematics, high school biology, high school chemistry, high school computer science, high school mathematics, high school physics, high school statistics, machine learning. Please cite the original MMLU paper when using this dataset.
提供机构:
TIGER-Lab
原始信息汇总

数据集概述

数据集来源

数据集内容

  • 该数据集包含MMLU中定义的STEM学科的子集。

包含的学科

  • abstract_algebra
  • anatomy
  • astronomy
  • college_biology
  • college_chemistry
  • college_computer_science
  • college_mathematics
  • college_physics
  • computer_security
  • conceptual_physics
  • electrical_engineering
  • elementary_mathematics
  • high_school_biology
  • high_school_chemistry
  • high_school_computer_science
  • high_school_mathematics
  • high_school_physics
  • high_school_statistics
  • machine_learning

引用信息

  • 使用该数据集时,请引用原始的MMLU论文。
搜集汇总
数据集介绍
main_image_url
构建方式
TIGER-Lab/MMLU-STEM数据集的构建,基于MMLU原始论文中定义的STEM学科子集,涵盖了从抽象代数到机器学习等众多学科领域。数据集通过精心设计的问答对形式,其中包含问题、选项、科目和答案,确保了数据的质量和多样性。
特点
该数据集的特点在于其专注于STEM领域的知识问答,覆盖了从大学到高中不同层次的教育内容。每一道题目都包含一个明确的问题、多个选项以及对应的正确答案,便于进行模型训练和评估。此外,数据集遵循MIT许可,保证了使用的灵活性和开放性。
使用方法
使用TIGER-Lab/MMLU-STEM数据集时,用户可以从HuggingFace的数据集库中直接下载。数据集包含测试集,用户可以将其用于模型测试或基准评估。在使用该数据集的研究成果发表时,需引用原始MMLU论文,以遵循学术规范。
背景与挑战
背景概述
TIGER-Lab/MMLU-STEM数据集,作为MMLU(Massive Multitask Language Understanding)的一个子集,专注于STEM(科学、技术、工程和数学)领域的知识。该数据集由TIGER-Lab团队开发,旨在推进自然语言处理技术在教育评估领域的应用。数据集涵盖了从抽象代数到机器学习等多个学科,其创建旨在解决多任务学习中的泛化问题,为研究人员提供了一个丰富的实验平台,自发布以来,在学术领域产生了广泛的影响。
当前挑战
该数据集面临的挑战主要在于其多学科、多领域的特性,如何确保模型在不同学科间有效迁移成为一大难题。此外,构建过程中,数据集的平衡性、准确性和覆盖面也是必须克服的关键挑战。具体而言,数据集需解决如何准确反映各学科知识难度、如何平衡不同学科样本比例、以及如何保证问题与答案的准确性等问题。
常用场景
经典使用场景
在科学文献研究领域,TIGER-Lab/MMLU-STEM数据集被广泛应用于评估模型在STEM(科学、技术、工程和数学)学科领域的问题解答能力。该数据集提供了一个多元化的题目集合,涵盖了从抽象代数到机器学习等多个学科,使得研究者能够全面考察模型在不同学科领域的理解力和知识应用能力。
实际应用
在实际应用中,TIGER-Lab/MMLU-STEM数据集被用于开发智能教育辅助系统,它可以帮助学生通过互动式学习解答疑惑,同时也能够辅助教师进行教学效果的评估和教学内容的优化。
衍生相关工作
基于TIGER-Lab/MMLU-STEM数据集,学术界衍生出了一系列经典工作,包括但不限于对现有模型在STEM领域的表现进行基准测试,以及开发新的教育评估工具和算法,这些研究进一步拓宽了人工智能在教育领域的应用范围。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作