five

joey234/mmlu-business_ethics

收藏
Hugging Face2023-08-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/joey234/mmlu-business_ethics
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: question dtype: string - name: choices sequence: string - name: answer dtype: class_label: names: '0': A '1': B '2': C '3': D - name: negate_openai_prompt struct: - name: content dtype: string - name: role dtype: string - name: neg_question dtype: string - name: fewshot_context dtype: string - name: fewshot_context_neg dtype: string splits: - name: dev num_bytes: 6764 num_examples: 5 - name: test num_bytes: 585886 num_examples: 100 download_size: 96118 dataset_size: 592650 configs: - config_name: default data_files: - split: dev path: data/dev-* - split: test path: data/test-* --- # Dataset Card for "mmlu-business_ethics" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

--- 数据集信息: 特征: - 字段名:问题(question),数据类型:字符串 - 字段名:选项集(choices),数据类型:字符串序列 - 字段名:答案(answer),数据类型:类标签(class_label),其标签映射为:'0'对应A、'1'对应B、'2'对应C、'3'对应D - 字段名:否定式OpenAI提示词(negate_openai_prompt),为结构体类型,包含: - 字段名:内容(content),数据类型:字符串 - 字段名:角色(role),数据类型:字符串 - 字段名:否定式问题(neg_question),数据类型:字符串 - 字段名:少样本上下文(fewshot_context),数据类型:字符串 - 字段名:否定式少样本上下文(fewshot_context_neg),数据类型:字符串 数据集划分: - 划分名称:开发集(dev),占用字节数:6764,样本量:5 - 划分名称:测试集(test),占用字节数:585886,样本量:100 下载大小:96118字节 数据集总大小:592650字节 配置项: - 配置名称:默认(default),对应数据文件: - 划分:dev,路径:data/dev-* - 划分:test,路径:data/test-* --- # “mmlu-business_ethics”数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
joey234
原始信息汇总

数据集概述

数据集名称

mmlu-business_ethics

数据集大小

  • 下载大小:96118字节
  • 数据集大小:592650字节

数据集特征

  • question:字符串类型
  • choices:字符串序列
  • answer:分类标签,对应选项为:
    • 0: A
    • 1: B
    • 2: C
    • 3: D
  • negate_openai_prompt:结构化数据,包含:
    • content:字符串类型
    • role:字符串类型
  • neg_question:字符串类型
  • fewshot_context:字符串类型
  • fewshot_context_neg:字符串类型

数据集分割

  • dev
    • 字节数:6764
    • 示例数:5
  • test
    • 字节数:585886
    • 示例数:100

数据文件配置

  • default 配置:
    • dev 数据文件路径:data/dev-*
    • test 数据文件路径:data/test-*
搜集汇总
数据集介绍
main_image_url
构建方式
在商业伦理这一交叉学科领域,数据集joey234/mmlu-business_ethics的构建遵循了严谨的学术规范。其核心内容源自大规模多任务语言理解评估框架,通过专家精心设计并筛选出涵盖商业伦理核心议题的单项选择题。每条数据样本均包含问题陈述、四个备选选项以及标准答案,并额外整合了经过人工标注的否定性提示与问题变体,以及用于少样本学习的上下文示例,确保了数据在逻辑一致性与领域覆盖度上的双重可靠性。
使用方法
对于致力于评估语言模型在商业伦理领域知识与推理能力的研究者而言,该数据集提供了清晰的使用路径。用户可直接加载数据集,利用其标准的‘问题-选项-答案’格式进行模型性能的零样本评估。通过调用数据集中的否定性提示与问题变体,研究者可以系统性地测试模型对语义转换与逻辑干扰的抵御能力。此外,数据集内嵌的少样本上下文示例,允许用户便捷地构建少样本学习提示,以考察模型在情境化引导下的表现,从而全面衡量其在复杂伦理情境中的理解深度。
背景与挑战
背景概述
在人工智能伦理评估领域,商业伦理数据集作为MMLU基准的关键组成部分,由研究团队于2023年构建,旨在系统评估模型在商业道德决策中的推理能力。该数据集聚焦于商业环境中的伦理困境,通过多选问答形式,考察模型对利益冲突、企业社会责任及职业道德等复杂议题的理解。其设计不仅推动了伦理敏感型AI的发展,也为跨学科研究提供了标准化评估工具,对促进人工智能与社会科学融合具有深远影响。
当前挑战
该数据集核心挑战在于如何精准模拟真实商业场景中的伦理模糊性,要求模型超越表面语义理解,进行深层次价值权衡。构建过程中,挑战包括伦理问题标注的主观性差异,需平衡文化背景与普世价值;同时,负向提示与上下文干扰的设计需避免引入偏见,确保评估的公正性与泛化性。这些挑战共同指向了伦理AI评估中标准化与复杂性之间的张力。
常用场景
经典使用场景
在商业伦理与人工智能交叉领域,joey234/mmlu-business_ethics数据集为评估大型语言模型在专业道德判断上的能力提供了基准。该数据集通过多项选择题形式,模拟真实商业场景中的伦理困境,要求模型基于给定问题和选项进行推理选择。其经典使用场景集中于模型性能的标准化测试,尤其在零样本或少样本学习设置下,研究者能够系统性地衡量模型对商业伦理原则的理解深度与一致性,为模型对齐人类价值观提供量化依据。
解决学术问题
该数据集有效应对了人工智能伦理研究中模型道德推理能力评估标准缺失的挑战。通过构建结构化的商业伦理问题集合,它使得研究者能够定量分析模型在利益冲突、社会责任、诚信经营等经典伦理议题上的表现。这不仅促进了可解释人工智能的发展,还为模型安全性与可靠性研究提供了关键数据支撑,推动了学术界对机器伦理规范化评估框架的建立,缩小了理论伦理原则与工程实践之间的鸿沟。
实际应用
在实际应用层面,joey234/mmlu-business_ethics数据集被广泛应用于企业人工智能系统的伦理审计与合规性检查。例如,在金融科技、人力资源管理和供应链决策等自动化系统中,该数据集可帮助开发团队测试算法决策是否符合商业道德规范。同时,它也为企业伦理培训工具的智能化提供了评估基础,辅助设计能够模拟复杂道德情境的交互式学习平台,从而提升从业者的伦理敏感性与决策质量。
数据集最近研究
最新研究方向
在商业伦理评估领域,基于MMLU框架的joey234/mmlu-business_ethics数据集正成为前沿研究的焦点。该数据集通过结构化的问题与选择项,结合否定性提示和少样本上下文,为大型语言模型在商业道德决策中的能力评估提供了精细化工具。当前研究热点集中于利用该数据集探索模型在复杂伦理场景下的推理鲁棒性,特别是在对抗性提示或语境反转情况下的表现分析。相关研究进一步推动了人工智能伦理对齐技术的发展,对确保AI系统在商业应用中的可靠性与社会责任具有深远意义,为跨学科融合提供了实证基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作