Point of View (POV) of Message Conversion Dataset

github2024-02-22 更新2024-05-31 收录

下载链接：

https://github.com/alexa/alexa-point-of-view-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集旨在帮助构建能够转换发送到虚拟助手的消息视角的AI系统。数据集包含输入消息和从发送者视角转换到虚拟助手视角的输出消息的平行语料库。此外，数据集还包括用于数据收集的调查和模型输出的人类评估结果。

This dataset is designed to assist in the development of AI systems capable of transforming the perspective of messages sent to virtual assistants. It comprises a parallel corpus of input messages and their corresponding output messages, which have been transformed from the sender's perspective to that of the virtual assistant. Additionally, the dataset includes surveys used for data collection and human evaluation results of model outputs.

创建时间：

2020-10-08

原始信息汇总

数据集概述

数据集名称

Point of View (POV) of Message Conversion Dataset

数据集目的

用于构建能够转换虚拟助手接收到的消息视角的AI系统，以实现更自然的对话交流。

数据集内容

数据结构：包含46563对输入和输出消息，分为训练集（32594对）、验证集（6985对）和测试集（6985对）。
数据示例：

input: tell @CN@ that ill be late output: hi @CN@, @SCN@ would like you to know that theyll be late.

其中@CN@和@SCN@分别代表接收者和发送者的占位符。

数据收集方法

数据来源：主要来自Amazon内部员工和Amazon Mechanical Turk的众包。
调查问卷：包含多种类型的输入消息，如声明、询问等，用于收集数据。

人类评估

评估模型：包括基于规则的模型、T5和CopyNet。
评估指标：
- 忠实度：评估转换后的消息是否准确保留了原始消息的内容。
- 自然度：评估转换后的消息听起来是否自然，评分范围为1（不清晰）至4（完美）。
评估结果：

Model Faithfulness Accuracy Naturalness Accuracy

CopyNet 0.94 0.97

T5 0.98 0.98

Rule-based 0.85 0.76

引用信息

@inproceedings{iglee2020, author={Isabelle G. Lee and Vera Zu and Sai Srujana Buddi and Dennis Liang and Purva Kulkarni and Jack Fitzgerald}, title={{Converting the Point of View of Messages Spoken to Virtual Assistants}}, year=2020, booktitle={Findings of EMNLP 2020}, doi={to-be-added}, url={to-be-added} }

搜集汇总

数据集介绍

构建方式

Point of View (POV) of Message Conversion Dataset的构建过程主要依赖于亚马逊内部员工和亚马逊Mechanical Turk平台的众包数据收集。通过设计特定类别的输入语句，如陈述句、是非问句、模糊问句等，确保了数据集的多样性和广泛性。数据收集过程中，采用了HTML格式的调查问卷，以控制数据质量并遵循基于规则的转换方法。最终，数据集包含了46563对输入和POV转换后的输出语句，并按照测试集、训练集和开发集进行了划分。

特点

该数据集的核心特点在于其平行语料库的构建，每一对数据均由原始输入语句和经过虚拟助手视角转换后的输出语句组成。数据集中的语句通过占位符（如@CN@和@SCN@）来表示接收者和发送者的姓名，增强了数据的通用性和可扩展性。此外，数据集涵盖了多种类型的输入语句，包括陈述句、是非问句、模糊问句等，为模型训练提供了丰富的语言场景。数据集还附带了用于数据收集的调查问卷和人类评估结果，进一步提升了其研究价值。

使用方法

使用该数据集时，研究人员可以将其应用于训练和评估虚拟助手的消息转换模型。数据集已按照测试集、训练集和开发集进行了划分，便于直接用于模型训练和性能评估。通过分析输入和输出语句的对应关系，可以开发出能够自然转换消息视角的AI系统。此外，数据集附带的人类评估结果和调查问卷为模型优化提供了参考依据。研究人员还可以根据数据集中的占位符设计，进一步扩展和定制模型的应用场景。

背景与挑战

背景概述

Point of View (POV) of Message Conversion Dataset 由Isabelle G. Lee等研究人员于2020年发布，旨在解决虚拟助手（VAs）在传递消息时的直译问题。该数据集的核心研究问题是如何使虚拟助手能够以更自然和对话化的方式传递消息，从而提升用户体验。数据集包含46563对输入和输出语句，涵盖了多种消息类型，如陈述句、疑问句和请求句。该数据集的研究成果发表在EMNLP 2020会议上，为虚拟助手的自然语言处理技术提供了重要的数据支持，推动了该领域的发展。

当前挑战

该数据集面临的挑战主要包括两个方面。首先，虚拟助手在传递消息时需要准确理解发送者的意图，并将其转换为接收者易于理解的形式，这要求模型具备高度的语义理解和生成能力。其次，在数据集的构建过程中，研究人员需要通过亚马逊Mechanical Turk等平台收集大量高质量的数据，并确保数据的多样性和代表性。此外，人类评估的复杂性也带来了挑战，特别是在评估消息的忠实性和自然性时，需要设计合理的评估指标并确保评估者之间的一致性。这些挑战为后续研究提供了重要的方向。

常用场景

经典使用场景

在虚拟助手（VA）领域，Point of View (POV) of Message Conversion Dataset 被广泛用于训练和评估自然语言处理模型，特别是那些涉及消息视角转换的模型。该数据集通过提供输入消息及其对应的视角转换输出，帮助研究人员构建能够更自然、更流畅地传递消息的虚拟助手。

衍生相关工作

基于该数据集，研究人员开发了多种模型，如规则模型、T5模型和CopyNet模型，并对其进行了人类评估。这些模型在消息视角转换任务中表现出色，进一步推动了虚拟助手技术的发展。此外，该数据集还为其他相关研究提供了宝贵的数据资源，促进了自然语言处理领域的进步。

数据集最近研究

Model	Faithfulness Accuracy	Naturalness Accuracy
CopyNet	0.94	0.97
T5	0.98	0.98
Rule-based	0.85	0.76