KODIS (Kobe DISpute corpus)

Name: KODIS (Kobe DISpute corpus)
Creator: 南加州大学, 密歇根大学, Capital One, 西北大学
Published: 2025-04-17 15:57:31
License: 暂无描述

arXiv2025-04-17 更新2025-04-22 收录

下载链接：

http://arxiv.org/abs/2504.12723v1

下载链接

链接失效反馈

官方服务：

资源简介：

KODIS是一个包含来自超过75个国家成千上万对话的双语争议解决语料库。该语料库的构建受到文化和冲突理论模型的启发，参与者在专家设计的典型客户服务争议中展开互动，以唤起强烈的情感和冲突。语料库包含丰富的性格、过程和结果测量指标。初步分析支持了关于愤怒表达导致升级螺旋的理论，并突显了文化在情感表达上的差异。

KODIS is a bilingual dispute resolution corpus containing thousands of conversations from over 75 countries. It is constructed under the inspiration of cultural and conflict theoretical models, where participants interact in expert-designed typical customer service dispute scenarios to evoke intense emotions and conflicts. The corpus includes rich sets of personality, process, and outcome measures. Preliminary analyses support the theory that anger expression leads to escalation spirals, and highlight cultural differences in emotional expression.

提供机构：

南加州大学, 密歇根大学, Capital One, 西北大学

创建时间：

2025-04-17

搜集汇总

数据集介绍

构建方式

KODIS数据集的构建基于多文化冲突解决的理论模型，通过在线平台Prolific招募来自75个国家的4,061名参与者。研究设计了一个典型的客户服务纠纷场景，旨在激发强烈的情感和冲突。参与者被随机匹配进行双向文本聊天，若无法匹配到人类伙伴，则与GPT-4进行交互。数据收集框架包括预任务问卷、角色扮演纠纷任务和后任务问卷，确保涵盖文化差异、个体特征、过程变量和结果变量等多维度数据。

使用方法

KODIS数据集适用于社会科学家研究情感表达、文化差异和冲突解决动态。在人工智能领域，可用于评估AI的社会能力及其在跨文化冲突中的表现。使用时需注意伦理问题，避免强化文化刻板印象。数据集访问限制为非商业用途，研究者可通过填写Google Form申请使用。数据分析时建议结合人类注释，以验证机器学习生成的情感标签的准确性。

背景与挑战

背景概述

KODIS（Kobe DISpute corpus）是由南加州大学、密歇根大学、西北大学等机构的研究人员于2023年至2024年间联合构建的多文化争议解决对话语料库。该数据集包含来自75个国家的4061名参与者的对话，旨在通过理论驱动的实验设计，探究文化差异对争议解决过程中情感表达、谈判策略及结果的影响。数据集基于尊严（Dignity）、面子（Face）和荣誉（Honor）文化理论框架，通过模拟客户服务争议场景激发强烈情感冲突，并记录行为过程、情感表达和结果指标。其创新性体现在首次系统整合人类-人类及人类-人工智能（GPT-4）的争议对话，为社会科学和自然语言处理领域提供了研究跨文化冲突动态的基准平台。

当前挑战

KODIS面临的核心挑战包括两方面：领域问题层面，争议解决对话具有目标对立性和情感复杂性，传统自然语言处理方法难以捕捉文化特异性表达（如荣誉文化中愤怒的升级效应）与多议题妥协机制的关联；数据构建层面，需克服跨文化参与者招募的均衡性、角色扮演实验的生态效度验证，以及人类-AI混合对话的伦理边界界定。具体表现为：1）情感标注受限于预训练模型（如GPT-4）的西方文化偏差，可能误判非西方参与者的情绪意图；2）争议结果的客观度量需平衡经济激励（奖金分配）与主观价值感知（如关系修复需求）的多维评估；3）文化聚类分析受限于自报告数据的可靠性，需解决低代表性国家的数据稀疏性问题。

常用场景

经典使用场景

KODIS数据集作为跨文化冲突解决研究的核心资源，其经典应用场景聚焦于分析对话中的情感动态与文化差异对争端升级的影响。通过模拟客户服务纠纷情境，该数据集捕捉了75个国家参与者在情绪化冲突中的交互模式，为研究愤怒表达如何引发螺旋式升级（如威胁性言论的连锁反应）提供了标准化实验场。社会科学家可利用其标注的战术使用、情绪强度及结果指标，验证冲突理论中关于尊严文化、面子文化与荣誉文化对争端策略选择的差异化影响。

解决学术问题

该数据集有效解决了跨文化冲突研究中的三大核心问题：其一，揭示了情感表达（尤其是愤怒）在争端情境与交易谈判中的相反作用机制，证实了文化背景对情绪效价的调节效应；其二，通过量化视角采择准确性与整合潜力指标，阐明了信息共享不足导致双输结局的认知根源；其三，构建了首个包含人类-AI混合交互的冲突语料库，为探究大语言模型在跨文化冲突中的社会能力偏见提供了基准。这些发现推动了冲突管理理论从西方中心向多元文化框架的范式转变。

实际应用

在实践层面，KODIS支撑了多个现实场景的创新：客户服务AI训练系统通过模拟数据学习识别情绪升级信号，及时触发调解策略；跨文化商务谈判培训工具利用其标注的战术库，帮助学员理解不同文化背景下的沟通禁忌；在线争议解决平台则基于该数据集的对话模式分析，开发了实时冲突预警算法。值得注意的是，部分研究团队正探索将其框架迁移至家庭调解和跨文化社区对话等社会服务领域，但需警惕算法可能强化的文化刻板印象问题。

数据集最近研究