MORAL INTEGRITY CORPUS (MIC)

Name: MORAL INTEGRITY CORPUS (MIC)
Creator: 乔治亚理工学院
Published: 2022-04-07 02:10:53
License: 暂无描述

arXiv2022-04-07 更新2024-06-21 收录

下载链接：

https://github.com/GT-SALT/mic

下载链接

链接失效反馈

官方服务：

资源简介：

MORAL INTEGRITY CORPUS（MIC）是由乔治亚理工学院创建的一个大型数据集，包含38,000个对话系统回复的人类编写提示。该数据集通过99,000个不同的经验法则（RoTs）捕捉了对话系统的道德假设，每个RoT反映了特定的道德信念，解释了聊天机器人的回复为何可能被视为可接受或有问题。数据集的创建过程涉及从大量公开数据中筛选和标注，确保内容的质量和相关性。MIC数据集主要用于理解和基准测试对话代理在开放领域“闲聊”设置中的隐含道德假设和灵活的常识推理能力，旨在解决对话系统中的道德和社交常识推理问题。

MORAL INTEGRITY CORPUS (MIC) is a large-scale dataset developed by the Georgia Institute of Technology, encompassing 38,000 human-written prompts for dialogue system responses. This corpus captures the moral assumptions inherent in dialogue systems via 99,000 distinct Rules of Thumb (RoTs), with each RoT representing a specific moral belief and explaining why a chatbot’s response could be deemed acceptable or problematic. The development process of the MIC dataset entailed screening and annotating data from a large pool of public sources to guarantee its content quality and relevance. Primarily, the MIC dataset is utilized to understand and benchmark the implicit moral assumptions and flexible commonsense reasoning abilities of dialogue agents within open-domain "small talk" scenarios, with the goal of resolving challenges concerning moral and social commonsense reasoning in dialogue systems.

提供机构：

乔治亚理工学院

创建时间：

2022-04-07

搜集汇总

数据集介绍

构建方式

在对话系统伦理评估领域，MORAL INTEGRITY CORPUS (MIC) 的构建采用了系统化的数据采集与标注流程。研究团队从公开的Reddit问答社区中筛选出包含道德相关词汇的开放式问题，随后将这些问题输入至BlenderBot、DialoGPT和GPT-Neo等前沿对话模型以生成回复。通过基于BERT的自动过滤器，确保了数据集中超过90%的对话对兼具可理解性、相关性与道德内容密度。最终，经由严格培训的众包标注员对38,000组提示-回复对进行了深度标注，产生了99,000条独特的经验法则（RoTs），每条RoT均辅以对齐度、共识度、违规严重性及道德基础等多维度结构化属性。

特点

该数据集的核心特征在于其独特的道德标注框架与丰富的元数据结构。MIC首次将经验法则范式系统化应用于开放域对话场景，每条RoT以自然语言形式阐释对话回复中隐含的道德假设，支持多重甚至相互冲突的道德判断共存。数据集涵盖九类道德与社会属性标签，包括基于道德基础理论的六维分类体系，并创新性地引入了全球共识度与违规严重性的量化标注。尤为突出的是，数据集中仅13%的RoT存在重复，体现了道德判断场景的高度多样性，同时标注元数据中包含了标注者的政治倾向与道德价值观问卷结果，为研究道德判断的主观差异性提供了宝贵资源。

使用方法

该数据集为对话系统的道德评估与生成提供了多层次的研究范式。在模型训练方面，研究者可利用提示-回复对与对应RoTs微调语言模型，实现道德规则的自动生成与解释；基于T-5等架构的MORAL TRANSFORMER在RoT生成任务中已达到接近人类水平的流畅度与相关性。在评估基准构建上，数据集支持开发道德属性分类器，用于预测生成文本的道德基础归属、共识度等维度。实际应用中，MIC可作为安全分类器的训练数据、可控生成系统的引导分布，或强化学习惩罚模型的监督信号，其提供的修订回复示例更为构建具备道德纠错能力的对话系统提供了直接参考。

背景与挑战

背景概述

随着开放域对话系统日益接近人类对话能力，其潜在伦理风险逐渐凸显，即模型可能生成具有冒犯性、伤害性或道德立场混乱的回应，从而侵蚀用户对系统道德完整性的信任。为系统化理解对话系统隐含的道德假设与价值判断，佐治亚理工学院与Meta AI研究院的研究团队于2022年联合构建了MORAL INTEGRITY CORPUS（MIC）数据集。该数据集聚焦于开放域闲聊场景，通过收集38,000组提示-回复对，并标注99,000条经验法则，旨在捕捉对话代理在回应中体现的道德直觉与价值取向。MIC不仅为评估对话系统的道德完整性提供了结构化基准，更通过引入政治倾向与道德基础问卷等元数据，深化了对道德判断主观性与文化差异性的探索，推动了可解释伦理人工智能的发展。

当前挑战

MIC数据集致力于解决开放域对话系统中道德完整性评估的核心挑战，即如何系统化识别与解释聊天机器人生成回复中隐含的道德偏差与价值冲突。具体构建挑战体现在两方面：其一，数据质量把控困难，现有聊天机器人常生成重复、空洞或存在幻觉的回复，需通过多层过滤机制确保90%以上数据兼具合理性与道德相关性；其二，道德标注的一致性难以保障，由于社会规范存在文化差异性与个体偏好分歧，研究团队设计了基于应用伦理学的标注框架，通过自由文本描述道德常识规则，并引入政治倾向与道德基础量化指标，以捕捉道德判断的多元性与主观性，从而在标准化与灵活性之间取得平衡。

常用场景

经典使用场景

在开放域对话系统伦理评估领域，MORAL INTEGRITY CORPUS（MIC）作为基准数据集，其经典应用场景在于系统性地分析与评估聊天机器人在自由对话中隐含的道德假设与价值取向。该数据集通过构建包含3.8万组提示-回复对及9.9万条经验法则的标注体系，为研究者提供了量化对话系统道德完整性的结构化框架。其核心价值在于将主观道德判断转化为可计算、可解释的规则描述，使得模型在应对涉及价值观冲突的开放性问题时，能够被置于统一的道德评估体系下进行横向比较与深度分析。

衍生相关工作

该数据集的发布催生了多个重要研究方向。在方法论层面，研究者基于MIC构建了道德变换器模型，实现了从对话序列到道德规则的可控生成，相关技术已延伸至跨文化道德推理系统的开发。在数据集扩展方面，后续工作将MIC与SOCIALCHEM-101、ETHICS等道德数据集结合，形成了多维度道德评估基准体系。值得关注的是，该数据集揭示的对话特有道德挑战——如合作原则违反、语用层面道德偏离等问题——推动了对话伦理评估从叙事文本向交互场景的范式迁移，促进了Delphi等通用道德推理模型在对话领域的适应性改进研究。

数据集最近研究