EmoWOZ
收藏arXiv2022-05-02 更新2024-06-21 收录
下载链接:
https://doi.org/10.5281/zenodo.5865437
下载链接
链接失效反馈官方服务:
资源简介:
EmoWOZ是一个大规模的手工情感标注任务导向对话数据集,基于MultiWOZ构建,包含超过11,000个对话和83,000个用户话语的情感标注。数据集不仅包括Wizard-of-Oz对话,还收集了同一领域内的人机对话,以充分覆盖数据驱动对话系统生命周期中可能发生的各种情感。EmoWOZ是首个此类大规模开源语料库,旨在为任务导向对话中的情感研究提供基础。数据集的应用领域包括情感识别和对话状态跟踪,旨在解决任务导向对话系统中情感处理的挑战。
EmoWOZ is a large-scale manually annotated task-oriented dialogue dataset built upon MultiWOZ. It contains over 11,000 dialogues and sentiment annotations for 83,000 user utterances. The dataset not only includes Wizard-of-Oz dialogues, but also collects human-machine dialogues within the same domain to fully cover all possible emotions that may arise during the lifecycle of data-driven dialogue systems. EmoWOZ is the first large-scale open-source corpus of this type, aiming to provide a foundational resource for sentiment research in task-oriented dialogues. Its application areas include sentiment recognition and dialogue state tracking, with the purpose of addressing the challenges of emotion processing in task-oriented dialogue systems.
提供机构:
海因里希·海涅大学
创建时间:
2021-09-10
搜集汇总
数据集介绍

构建方式
EmoWOZ数据集的构建基于MultiWOZ,一个多领域任务导向对话数据集。该数据集包含了超过11K个对话和超过83K个用户话语的情感标注。为了充分覆盖数据驱动对话系统中可能出现的各种情感,除了MultiWOZ中的Wizard-of-Oz对话,我们还收集了同一组领域内的人机对话。为了更好地捕捉用户目标相关的情感认知背景,我们提出了一个新颖的情感标注方案,其中包括7个情感类别,这些类别是根据Ortony, Clore和Collins(OCC)模型改编的,并专门用于任务导向对话。
特点
EmoWOZ数据集的特点在于其规模之大,涵盖了丰富的情感标注,以及公共可用性。该数据集是目前已知的第一批大规模开源情感识别任务导向对话语料库。此外,我们提出的情感标注方案包含7个情感类别,这些类别是根据OCC模型改编的,专门用于捕捉与用户目标相关的各种情感。最后,我们报告了一系列实验结果,以展示该语料库在情感识别和状态跟踪任务中的可用性。
使用方法
使用EmoWOZ数据集的方法包括情感识别和状态跟踪。在情感识别任务中,我们使用多种模型进行了实验,包括BERT、ContextBERT、DialogueRNN和COSMIC。这些模型在EmoWOZ数据集上都取得了良好的性能。此外,我们还发现,将MultiWOZ和DialMAGE数据集进行补充可以提高模型在情感识别任务上的性能。在状态跟踪任务中,我们将情感标签作为辅助任务与对话状态跟踪任务进行多任务学习,结果显示,加入情感标签可以显著提高对话状态跟踪的性能。
背景与挑战
背景概述
在对话系统中融入人类智能,尤其是情感智能,一直是人工智能领域的一项重要挑战。情感智能,即调节、感知、吸收和表达情感的能力,是通用智能的关键组成部分。EmoWOZ数据集的创建正是为了解决这一挑战,特别是针对面向任务的对话系统中的情感识别问题。该数据集由德国杜塞尔多夫海因里希·海涅大学的研究团队构建,基于多领域面向任务的对话数据集MultiWOZ,包含超过11K个对话和83K个用户话语的情感标注。EmoWOZ是首个大规模开源的情感识别数据集,旨在为研究面向任务的对话系统中的情感识别提供一个坚实的基础。
当前挑战
尽管情感识别在闲聊对话中已经得到了广泛的关注,但在面向任务的对话中,情感识别的研究仍然相对较少。EmoWOZ数据集面临的挑战主要包括:1)所解决的领域问题:面向任务的对话系统中的情感识别,需要考虑用户目标的实现与否,以及用户对系统性能的感知;2)构建过程中所遇到的挑战:收集和标注大规模的情感数据集,需要确保标注的一致性和质量,同时还需要考虑不同对话环境下情感表达的差异。
常用场景
经典使用场景
在任务导向的对话系统中,EmoWOZ数据集常被用于情感识别研究。通过对用户话语的情感标注,该数据集提供了丰富的情感表达信息,使得研究者可以训练和评估情感识别模型,从而提升对话系统的情感智能。此外,EmoWOZ数据集也被用于对话状态跟踪,通过情感标签的辅助,对话状态跟踪模型可以更准确地理解用户意图和目标,从而提高对话系统的整体性能。
实际应用
EmoWOZ数据集在实际应用中,可以用于提升对话系统的情感智能,使其能够更好地理解和回应用户的情感需求。例如,在客户服务领域,通过EmoWOZ数据集训练的情感识别模型可以识别用户的满意度、不满等情感,从而提供更加个性化的服务。此外,EmoWOZ数据集还可以用于对话状态跟踪,帮助对话系统更好地理解用户意图和目标,从而提高对话系统的整体性能。
衍生相关工作
基于EmoWOZ数据集,研究者们进行了大量的情感识别和对话状态跟踪研究。例如,Heck等人(2020)提出了一个基于多任务学习的对话状态跟踪模型,通过结合情感识别任务,显著提高了对话状态跟踪的准确性。此外,Ghosal等人(2020)提出了一个名为COSMIC的情感识别模型,通过结合情感知识和对话上下文,实现了更准确的情感识别。这些研究成果为任务导向对话系统的情感智能提升提供了重要的技术支持。
以上内容由遇见数据集搜集并总结生成



