Deviation adapted Virtual Agent (DevAV) Dialogue-Corpus

github2021-03-19 更新2024-05-31 收录

下载链接：

https://github.com/AbhiTC/DevAV-Dialogue-Corpus

下载链接

链接失效反馈

官方服务：

资源简介：

包含动态任务目标的对话语料库，领域为销售，标注类型包括意图、槽位和用户情感。

A dialogue corpus encompassing dynamic task objectives within the sales domain, annotated with intent, slot, and user sentiment.

创建时间：

2021-01-01

原始信息汇总

数据集概述

数据集名称

Deviation adapted Virtual Agent (DevAV) Dialogue-Corpus

数据集特点

对话类型：动态任务目标的会话对话
领域：销售领域
标注信息：意图槽和用户情感

数据集内容

对话数量：1000对话（25样本对话 + 975基础对话）
语句数量：8335条语句
类别：7个类别
槽位：18个槽位

数据集使用知识库

来源：GSMAreana数据集
内容：2697个独特的电话样本和18个属性（槽位）

数据集结构

系统模块

自然语言理解 (NLU)
- 子模块：
  - 意图和槽位标记器：使用联合BERT模型，意图准确率93.11%，槽位准确率87.39%。
  - 情感分类器：使用预训练的XLNet模型，准确率96.68%。
动态目标适配对话管理器 (DM)
- 主要组件：
  - 目标管理器：跟踪对话状态的差异并制定新目标。
  - 对话策略学习器：使用强化学习算法（DQN）优化。
自然语言生成 (NLG)
- 生成方式：基于模板的NLG系统，平均每个动作有4个响应模板。

联系方式

电子邮件：abhisektiwari2014@gmail.com

搜集汇总

数据集介绍

构建方式

Deviation adapted Virtual Agent (DevAV) Dialogue-Corpus 数据集的构建基于动态任务目标驱动的对话系统。该数据集通过整合自然语言理解（NLU）、动态目标适应对话管理器（DM）和自然语言生成（NLG）三个子模块，构建了一个完整的对话流程。数据集包含1000个对话，共计8335条话语，涵盖7个类别和18个槽位。知识库部分采用了GSMAreana数据集的子集，包含2697个独特的手机样本和18个属性。NLU模块采用联合BERT模型进行意图和槽位标注，情感分类则通过预训练的XLNet模型实现。DM模块通过强化学习算法（DQN）优化对话策略，动态调整用户目标。

特点

DevAV 数据集的特点在于其动态任务目标的适应能力，能够实时跟踪和调整用户目标，以最大化用户效用。数据集不仅包含丰富的对话样本，还标注了意图、槽位和用户情感信息，为研究动态目标驱动的对话系统提供了高质量的数据支持。NLU模块的高准确率（意图分类93.11%，槽位填充87.39%）和情感分类模块的优异表现（XLNet准确率96.68%）进一步提升了数据集的实用性和研究价值。此外，数据集的领域聚焦于销售场景，涵盖了多种手机属性，为相关领域的研究提供了丰富的实验素材。

使用方法

DevAV 数据集的使用方法主要围绕动态目标驱动的对话系统展开。研究者可以通过加载数据集，利用NLU模块进行意图和槽位标注，并结合情感分类模块分析用户反馈。DM模块的动态目标管理功能可用于模拟用户目标的实时调整，优化对话策略。NLG模块的模板生成系统则为对话响应提供了多样化的选择。数据集适用于训练和评估动态目标驱动的对话代理，特别是在销售领域的应用场景中。研究者可通过引用相关文献和联系数据集作者获取更多详细信息。

背景与挑战

背景概述

Deviation adapted Virtual Agent (DevAV) Dialogue-Corpus 数据集由研究人员 Abhisek Tiwari 等人于近期开发，旨在解决目标导向对话系统中用户目标动态变化的挑战。传统虚拟助手通常假设用户目标固定不变，而现实场景中用户目标往往随对话进程动态调整。该数据集通过引入动态目标驱动模块（GDM），结合深度强化学习技术，构建了一个能够实时跟踪和更新用户目标的对话管理系统。数据集包含 1000 个对话，涵盖销售领域，标注了意图、槽位及用户情感信息，为动态目标驱动的对话系统研究提供了重要支持。

当前挑战

DevAV 数据集的研究面临两大核心挑战。其一，动态目标驱动的对话系统需解决用户目标实时变化的复杂性，传统固定目标假设难以应对用户需求的灵活调整。其二，数据集构建过程中，如何准确捕捉用户情感反馈并将其融入对话管理策略是一大难题。此外，数据集依赖于有限的知识库（GSMAreana），可能限制了其在更广泛领域的适用性。这些挑战要求研究者在自然语言理解、对话策略优化及情感分析等方面进行深入探索，以提升对话系统的动态适应能力。

常用场景

经典使用场景

DevAV对话语料库在销售领域的动态任务目标对话系统中展现了其经典应用场景。该数据集通过模拟用户在购买过程中可能出现的动态目标变化，如升级、降级或更新购买需求，为研究者和开发者提供了一个真实的对话环境。这种环境使得对话系统能够更好地理解和适应用户的即时需求，从而提高用户满意度。

衍生相关工作

基于DevAV数据集的研究工作衍生了许多经典成果，特别是在自然语言理解（NLU）和对话管理（DM）领域。例如，研究者们利用该数据集开发了基于BERT和XLNet的联合意图分类和槽位填充模型，这些模型在意图识别和情感分类任务中表现出色。此外，该数据集还推动了基于强化学习的对话策略优化研究，为智能对话系统的进一步发展奠定了基础。

数据集最近研究