Negochat Corpus

github2023-08-28 更新2024-05-31 收录

下载链接：

https://github.com/vaskonov/negochat_corpus

下载链接

链接失效反馈

官方服务：

资源简介：

Negochat Corpus是一个在谈判领域中的人机对话语料库，通过Amazon Mechanical Turk采用Wizard-Of-Oz方法收集。该数据集包含105个求职谈判领域的对话，涉及雇主和候选人之间的谈判，每个话语包含一种或多种对话行为，如提供、接受、拒绝、查询、问候和退出。

The Negochat Corpus is a human-machine dialogue corpus in the field of negotiation, collected using the Wizard-Of-Oz method via Amazon Mechanical Turk. This dataset comprises 105 dialogues in the domain of job negotiations, involving discussions between employers and candidates. Each utterance includes one or more dialogue acts, such as offers, acceptances, rejections, inquiries, greetings, and exits.

创建时间：

2015-10-13

原始信息汇总

数据集概述

数据集名称

The Negochat Corpus of Human-agent Negotiation Dialogues

数据集描述

Negochat corpus 是一个注释过的自然语言人机谈判对话语料库，专注于谈判领域。该语料库通过Amazon Mechanical Turk平台收集，采用Wizard-Of-Oz方法，其中一位“巫师”人类实时将参与者的自然语言话语翻译成语义语言。

数据集内容

包含105个对话，涉及职位候选人谈判领域。
谈判双方为雇主和候选人。
每个话语中包含以下对话行为之一或多个：Offer, Accept, Reject, Query, Greet, Quit。

数据集引用

若在研究中使用此软件，建议引用以下文献：

@inproceedings{konovalov2016negochat, title={The Negochat Corpus of Human-agent Negotiation Dialogues}, author={Konovalov, Vasily and Artstein, Ron and Melamud, Oren and Dagan, Ido}, booktitle={Proceedings of the 10th International Conference on Language Resources and Evaluation, LREC 2016}, year={2016}, pages={3141-3145}, url={www.lrec-conf.org/proceedings/lrec2016/pdf/240_Paper.pdf} }

联系方式

如有疑问，请联系 vaskoncv@gmail.com。

搜集汇总

数据集介绍

构建方式

Negochat语料库的构建采用了亚马逊Mechanical Turk平台，结合Wizard-Of-Oz方法进行数据收集。在这一过程中，参与者与一个模拟的智能代理进行自然语言对话，而背后的‘巫师’则实时将参与者的自然语言表达转换为语义语言。这种构建方式确保了语料库在谈判领域的真实性和多样性，同时为后续的语义分析和对话系统研究提供了坚实的基础。

使用方法

Negochat语料库的使用方法主要围绕其标注的对话行为展开。研究人员可以通过分析对话中的‘提议’、‘接受’、‘拒绝’等行为，深入探讨谈判策略的生成与响应机制。此外，该语料库还可用于训练和评估对话系统，特别是在谈判场景下的自然语言生成与理解任务。通过引用相关文献，研究人员可以进一步扩展其在对话系统与语义分析领域的研究工作。

背景与挑战

背景概述

Negochat Corpus 是一个专注于人机谈判对话的自然语言语料库，由Vasily Konovalov等研究人员于2016年提出，并在第十届国际语言资源与评估会议（LREC 2016）上发布。该语料库通过亚马逊的Mechanical Turk平台收集，采用Wizard-Of-Oz方法，即由人类操作员实时将参与者的自然语言表达转换为语义语言。Negochat Corpus 包含105个关于求职者与雇主之间谈判的对话，涵盖了诸如报价、接受、拒绝、查询、问候和退出等多种对话行为。该数据集为研究人机交互、自然语言处理及谈判策略提供了宝贵的资源，推动了相关领域的发展。

当前挑战

Negochat Corpus 在构建和应用过程中面临多重挑战。首先，谈判对话的复杂性要求语料库能够准确捕捉和分类多种对话行为，这对标注的精确性和一致性提出了高要求。其次，Wizard-Of-Oz方法的实时转换过程可能导致语义信息的丢失或误解，影响数据的质量。此外，谈判场景的多样性和动态性使得模型在泛化能力上面临挑战，如何在不同情境下保持对话的连贯性和有效性仍需进一步研究。这些挑战不仅体现在数据集的构建过程中，也影响了后续基于该数据集的研究和应用。

常用场景

经典使用场景

Negochat Corpus 数据集在自然语言处理和人工智能领域中被广泛应用于模拟和解析人类与代理之间的谈判对话。通过提供105个在求职谈判场景下的对话，该数据集为研究者提供了一个丰富的资源，用于训练和测试对话系统，特别是在理解和生成谈判策略方面。

解决学术问题

Negochat Corpus 解决了在自然语言处理领域中，特别是在对话系统和谈判策略研究中，缺乏高质量、标注详细的对话数据的问题。该数据集通过提供详细的对话行为标注（如提议、接受、拒绝等），使得研究者能够深入分析谈判过程中的语言使用和策略选择，从而推动了对话系统在理解和模拟人类谈判行为方面的进步。

实际应用

在实际应用中，Negochat Corpus 被用于开发更智能的虚拟助手和自动化谈判系统。这些系统能够理解复杂的谈判对话，并作出相应的反应，从而在人力资源、客户服务和电子商务等领域提供支持。此外，该数据集也被用于教育和培训目的，帮助学习者理解谈判技巧和策略。

数据集最近研究