five

joey234/mmlu-professional_accounting

收藏
Hugging Face2023-08-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/joey234/mmlu-professional_accounting
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: question dtype: string - name: choices sequence: string - name: answer dtype: class_label: names: '0': A '1': B '2': C '3': D - name: negate_openai_prompt struct: - name: content dtype: string - name: role dtype: string - name: neg_question dtype: string - name: fewshot_context dtype: string - name: fewshot_context_neg dtype: string splits: - name: dev num_bytes: 7031 num_examples: 5 - name: test num_bytes: 1064063 num_examples: 282 download_size: 182011 dataset_size: 1071094 configs: - config_name: default data_files: - split: dev path: data/dev-* - split: test path: data/test-* --- # Dataset Card for "mmlu-professional_accounting" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

数据集信息: 特征: - 字段名:question,数据类型:字符串 - 字段名:choices,数据类型:字符串序列 - 字段名:answer,数据类型:类别标签(class_label),其名称映射如下: '0' 对应 A,'1' 对应 B,'2' 对应 C,'3' 对应 D - 字段名:negate_openai_prompt,数据类型:结构体,包含两个子字段: - 子字段名:content,数据类型:字符串 - 子字段名:role,数据类型:字符串 - 字段名:neg_question,数据类型:字符串(反向问题) - 字段名:fewshot_context,数据类型:字符串(少样本上下文) - 字段名:fewshot_context_neg,数据类型:字符串(反向少样本上下文) 数据集拆分: - 拆分名称:dev,字节数:7031,样本数量:5 - 拆分名称:test,字节数:1064063,样本数量:282 下载大小:182011 字节 数据集总大小:1071094 字节 配置方案: - 配置名称:default,数据文件对应如下: - 拆分dev:路径为 data/dev-* - 拆分test:路径为 data/test-* --- # 「专业会计学MMLU」数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
joey234
原始信息汇总

数据集概述

数据集名称

mmlu-professional_accounting

数据特征

  • question: 数据类型 - string
  • choices: 数据类型 - sequence of string
  • answer: 数据类型 - class_label,标签名称为:
    • 0: A
    • 1: B
    • 2: C
    • 3: D
  • negate_openai_prompt: 结构化数据,包含:
    • content: 数据类型 - string
    • role: 数据类型 - string
  • neg_question: 数据类型 - string
  • fewshot_context: 数据类型 - string
  • fewshot_context_neg: 数据类型 - string

数据分割

  • dev:
    • 大小: 7031 bytes
    • 示例数量: 5
  • test:
    • 大小: 1064063 bytes
    • 示例数量: 282

数据集大小

  • 下载大小: 182011 bytes
  • 数据集总大小: 1071094 bytes

配置文件

  • config_name: default
  • data_files:
    • dev: path - data/dev-*
    • test: path - data/test-*
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集joey234/mmlu-professional_accounting的构建,旨在针对专业会计领域的知识进行评估。数据集通过精心设计的问题、选项以及正确答案,辅以否定提示和上下文信息,形成了对专业会计知识点的全面覆盖,其构建方式确保了评估的深度与广度。
使用方法
使用该数据集时,用户可依据数据文件路径加载开发集和测试集,通过问题、选项和答案的对应关系,进行模型的训练和验证。此外,数据集中的否定提示和上下文信息,可用于进一步优化模型对于复杂问题的处理能力。
背景与挑战
背景概述
在专业会计领域,为了评估机器学习模型对复杂专业知识的理解和应用能力,joey234/mmlu-professional_accounting数据集应运而生。该数据集由专业研究人员于近年来创建,旨在通过模拟专业会计问题,推动自然语言处理技术在会计领域的实际应用。数据集汇集了大量专业会计问题及答案,涵盖了会计实务中的各类挑战性问题,对于推动会计自动化和智能化研究具有重要意义。
当前挑战
该数据集在构建过程中,面临了如何准确模拟专业会计环境下的复杂问题以及如何确保答案的准确性的挑战。研究领域的问题主要包括如何使机器学习模型能够准确理解专业术语、逻辑推理以及专业判断。此外,数据集在构建时还需克服数据采集、标注一致性以及测试集与训练集分布一致性的技术难题。
常用场景
经典使用场景
在人工智能领域,尤其是自然语言处理的研究与应用中,'joey234/mmlu-professional_accounting'数据集被广泛用于评估模型在专业会计知识问答方面的性能。该数据集包含了多项选择题形式的问题,每个问题都配有四个选项和一个正确答案,旨在训练模型准确理解和回答专业会计问题。
解决学术问题
该数据集解决了学术研究中对于专业领域知识问答自动化评估的需求,为研究者提供了一个标准化的测试平台。通过该数据集,研究者能够有效地衡量和比较不同模型在处理专业会计问题时的准确性和泛化能力,推动了自然语言处理技术在专业领域中的应用。
实际应用
在实践应用中,'joey234/mmlu-professional_accounting'数据集可用于开发和优化会计自动化系统,例如智能问答机器人、在线考试系统等。这些系统能够提供即时的会计知识问答服务,提高会计工作的效率和准确性。
数据集最近研究
最新研究方向
在会计学领域,joey234/mmlu-professional_accounting数据集正被用于推动机器学习在专业会计知识应用的研究。该数据集以多选题形式,涵盖了专业会计问题,旨在训练模型对会计准则、实践问题进行理解和判断。近期研究聚焦于利用此数据集提升模型的少样本学习能力,通过fewshot上下文提供有限的知识背景,以模拟实际工作中会计人员面对新颖问题的情景。此类研究不仅有助于完善会计领域的自然语言处理模型,也为会计自动化和决策支持系统提供了新的视角,对会计行业数字化转型具有深远的影响。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作