five

joey234/mmlu-college_mathematics

收藏
Hugging Face2023-08-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/joey234/mmlu-college_mathematics
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: question dtype: string - name: choices sequence: string - name: answer dtype: class_label: names: '0': A '1': B '2': C '3': D - name: negate_openai_prompt struct: - name: content dtype: string - name: role dtype: string - name: neg_question dtype: string - name: fewshot_context dtype: string - name: fewshot_context_neg dtype: string splits: - name: dev num_bytes: 6168 num_examples: 5 - name: test num_bytes: 422940 num_examples: 100 download_size: 81860 dataset_size: 429108 configs: - config_name: default data_files: - split: dev path: data/dev-* - split: test path: data/test-* --- # Dataset Card for "mmlu-college_mathematics" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

数据集信息(dataset_info): 特征字段: - 字段名称:问题(question),数据类型:字符串 - 字段名称:选项(choices),数据类型:字符串序列 - 字段名称:答案(answer),数据类型:分类标签(class_label),标签映射规则为:'0'对应A,'1'对应B,'2'对应C,'3'对应D - 字段名称:反向OpenAI提示词(negate_openai_prompt),结构体类型,包含以下子字段: - 子字段名称:内容(content),数据类型:字符串 - 子字段名称:角色(role),数据类型:字符串 - 字段名称:反向问题(neg_question),数据类型:字符串 - 字段名称:少样本上下文(fewshot_context),数据类型:字符串 - 字段名称:反向少样本上下文(fewshot_context_neg),数据类型:字符串 数据集划分: - 划分名称:开发集(dev),字节大小:6168,样本数量:5 - 划分名称:测试集(test),字节大小:422940,样本数量:100 下载大小:81860字节 数据集总大小:429108字节 数据集配置: - 配置名称:默认配置(default),关联数据文件: - 数据集划分:开发集(dev),文件路径:data/dev-* - 数据集划分:测试集(test),文件路径:data/test-* # “mmlu-college_mathematics”数据集卡片(Dataset Card) [更多信息请参阅](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
joey234
原始信息汇总

数据集概述

数据集名称

"mmlu-college_mathematics"

数据集特征

  • question: 字符串类型
  • choices: 字符串序列
  • answer: 分类标签,具体为:
    • 0: A
    • 1: B
    • 2: C
    • 3: D
  • negate_openai_prompt: 结构化数据,包含:
    • content: 字符串类型
    • role: 字符串类型
  • neg_question: 字符串类型
  • fewshot_context: 字符串类型
  • fewshot_context_neg: 字符串类型

数据集分割

  • dev:
    • 字节数: 6168
    • 示例数: 5
  • test:
    • 字节数: 422940
    • 示例数: 100

数据集大小

  • 下载大小: 81860字节
  • 数据集总大小: 429108字节

数据文件配置

  • default 配置:
    • dev: 路径为 "data/dev-*"
    • test: 路径为 "data/test-*"
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集 joey234/mmlu-college_mathematics 的构建基于大学数学领域的问题与解答,涵盖了问题的多种选择以及正确答案。每一道题目均配有四个选项,并明确标注了正确选项。此外,数据集还包含用于生成问题的开放AI提示信息的否定版本,以及正面和负面的问题表述,为模型训练提供了丰富的上下文信息。
特点
数据集的特点在于其全面覆盖了大学数学的相关知识点,问题形式与选择题相似,便于评估模型在数学问题解答方面的能力。数据集分为开发集和测试集,便于研究者进行模型的开发和性能评估。每一题目均提供了少数示例上下文,有助于模型在少量样本学习情况下也能做出准确判断。
使用方法
使用该数据集时,研究者可以依据数据集提供的配置信息,通过指定的路径加载开发集和测试集。数据集的结构化设计使得研究者能够轻松地提取问题、选项、答案以及相关上下文信息,进而用于模型训练、验证和测试,以评估模型在大学数学问题解答方面的性能。
背景与挑战
背景概述
在数学教育研究领域,为了评估和促进大学生数学知识的掌握与应用能力,joey234/mmlu-college_mathematics数据集应运而生。该数据集由相关研究人员或机构于近期创建,旨在通过实际数学问题的形式,对大学生的数学理解力进行量化分析。数据集的构建,不仅为数学教育效果的评估提供了有力工具,也为相关教育软件的开发与优化提供了丰富资源。
当前挑战
数据集在构建过程中面临的挑战主要包括:如何确保所包含的数学问题能够全面覆盖大学数学课程的核心知识点;如何平衡问题的难度,使之既能够区分不同水平的学生,又不会过度偏难导致无法反映学生的实际水平;以及在数据标注过程中,如何避免主观错误,确保答案的准确性。此外,在所解决的领域问题方面,数据集需面对如何有效测量大学生数学应用能力,以及如何将这种能力评估与实际教学相结合的挑战。
常用场景
经典使用场景
在高等教育领域,尤其是数学教育研究领域,'joey234/mmlu-college_mathematics'数据集的应用尤为关键。该数据集包含了一系列大学数学问题及其选项,旨在通过问题解答的形式,评估模型在处理高等教育数学问题的能力。其经典的使用场景在于,通过提供数学问题以及多个选择答案,研究人员可以训练或测试机器学习模型在数学领域的理解力和推理能力。
衍生相关工作
基于此数据集,学术界已衍生出多项相关工作,如开发更为复杂的数学问题解答模型,构建面向不同教育阶段的数学题库,以及研究模型在处理非标准化数学问题上的表现,这些工作进一步拓展了数据集的应用范围和影响力。
数据集最近研究
最新研究方向
在高等教育与人工智能结合的领域中,joey234/mmlu-college_mathematics数据集以其独特的结构特征,成为研究的热点。该数据集以大学数学教育为背景,涵盖了问题、选项、答案以及用于生成开放式问题的提示等丰富字段,使得它在自然语言处理和数学教育研究中的应用尤为重要。近期研究聚焦于利用此数据集进行数学问题解答模型的开发与评估,旨在提高机器学习模型在解决复杂数学问题上的准确性。此研究方向不仅推动了数学教育领域的智能化进程,也为相关算法的改进和优化提供了宝贵的实验资源,对教育技术领域产生了深远的影响。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作