five

Taskmaster-1

收藏
arXiv2019-09-02 更新2024-06-21 收录
下载链接:
https://g.co/dataset/taskmaster-1
下载链接
链接失效反馈
官方服务:
资源简介:
Taskmaster-1是由谷歌有限责任公司创建的一个包含13,215条对话的数据集,旨在推动对话系统的发展。该数据集涵盖六个领域,包括订餐、预约维修、打车服务等,通过两种方法收集:一种是两人口语对话,另一种是自对话,即单人撰写整个对话。数据集的创建过程涉及训练代理和众包工人,不限制于详细脚本或小知识库,因此包含更真实和多样的对话。Taskmaster-1的应用领域广泛,旨在解决机器学习对话系统中的数据质量和多样性问题,支持自然语言理解和生成研究。

Taskmaster-1 is a dataset containing 13,215 dialogues created by Google LLC, aimed at advancing the development of conversational systems. It covers six domains including food ordering, appointment booking for repairs, ride-hailing services and others. The dataset is collected via two approaches: two-person spoken dialogues, and self-dialogues where a single person writes the entire conversation. The creation process involved training agents and crowdsourced workers, with no restrictions on detailed scripts or small knowledge bases, thus resulting in more authentic and diverse dialogues. Taskmaster-1 has a wide range of application scenarios, and it is designed to solve the problems of data quality and diversity in machine learning-based conversational systems, supporting research on natural language understanding and generation.
提供机构:
谷歌有限责任公司,山景城,加利福尼亚
创建时间:
2019-09-02
搜集汇总
数据集介绍
main_image_url
构建方式
Taskmaster-1数据集通过两种互补的流程构建,涵盖六项任务领域:订披萨、预约汽车维修、安排乘车服务、订购电影票、点咖啡及预订餐厅。第一种为双人“巫师之佐”(WOz)方法,由经过培训的代理扮演数字助手,众包工人扮演用户,通过语音进行自然交互,营造自动化助手的沉浸式体验。第二种为“自对话”方法,众包工人独自撰写完整对话,同时扮演用户与助手角色,基于给定的任务场景自由发挥。所有对话均采用简化的API调用与参数标注,无需复杂注释模式,仅标记执行交易所需的关键变量,如电影票中的电影名、影院、时间及票数,并辅以“接受”或“拒绝”标签以标识交易状态。
特点
该数据集包含13,215个任务导向对话,其中5,507个为双人语音对话,7,708个为单人书面对话,平均每段对话约23轮次,确保语境丰富。与现有基准如MultiWOZ相比,Taskmaster-1拥有更多独特词汇(自对话部分达21,894个)及近十倍的真实世界命名实体,语言模型困惑度更高(自对话部分为17.08),BLEU得分更低(6.53),反映出其对话的多样性与现实性。双人对话通过WOz平台收集,用户误以为与自动化系统交互,从而产生更接近真实语音的流畅表达;自对话则避免了理解错误导致的挫败感,且能高效模拟各种交互场景,包括错误处理与修复。数据集不受限于小知识库或详细脚本,因而语言更为丰富自然。
使用方法
Taskmaster-1适用于多种研究场景,主要聚焦于任务导向对话系统的开发与评估。研究者可利用其文本对话及API标注训练序列到序列(seq2seq)模型,如Transformer、LSTM及卷积架构,以完成响应生成或参数预测任务。数据集提供基线性能指标,包括困惑度、BLEU得分及人工评价(如LIKERT评分与排名),便于模型对比。由于标注层抽象于服务提供商API,同一模型可适配多种类似功能的服务。此外,数据集支持探索书面与口语对话的差异、话语模式、错误处理等语言现象。建议将双人对话与自对话分开或联合训练,以检验不同数据来源对模型泛化能力的影响。
背景与挑战
背景概述
在数据驱动的对话系统研究领域,高质量、目标导向的对话数据匮乏始终是制约进展的核心瓶颈。为应对这一挑战,谷歌团队联合蒙特利尔大学与加州大学圣塔芭芭拉分校的研究人员于2019年推出了Taskmaster-1数据集。该数据集包含13,215个基于任务的对话,涵盖订餐、预约维修、叫车、购票、咖啡点单及餐厅预订六大领域。其独特之处在于采用两种互补的收集方法:一是双人参与的“奥兹巫师”口语对话模式,由训练有素的代理与众包工人模拟人机交互;二是单人自撰对话模式,由众包工人独立完成全篇对话。数据集以API调用和参数进行标注,避免了复杂的语义标注框架,显著降低了标注成本。Taskmaster-1的推出为多轮任务型对话研究提供了更真实、更多样化的语言资源,其丰富的命名实体和自然的对话流对现有基准如MultiWOZ形成了有力补充,推动了对话系统从规则驱动向数据驱动的范式转变。
当前挑战
Taskmaster-1数据集所面临的挑战主要体现在两个方面。首先,在领域问题层面,任务型对话系统需应对自然语言的高度上下文依赖性与歧义性,尤其是在多轮、多主题的交互中,用户意图可能动态变化,如中途改变订单或遇到服务不可用的情况,这对模型的鲁棒性和适应性提出了严苛要求。现有模型如Transformer在生成响应时虽能获得较低困惑度,但BLEU分数仍不理想,表明生成的自然度和多样性仍是难题。其次,在构建过程中,双人口语对话模式虽能捕捉真实交互中的言语不清与错误模式,但其收集流程复杂且成本高昂,需要训练专门代理、处理技术故障(如WebRTC连接中断)及转录用户语音;而自撰对话虽高效廉价,却无法再现口语对话中的不流畅性和复杂错误模式,导致两种数据源在语言分布上存在显著差异,给联合建模带来了额外挑战。
常用场景
经典使用场景
Taskmaster-1数据集最经典的使用场景在于构建和评估面向任务的对话系统,特别是在多轮、多领域的自然语言理解与生成任务中。该数据集涵盖了订购披萨、预约汽车维修、叫车服务、购买电影票、订购咖啡以及餐厅预订等六个真实生活领域,为研究者提供了丰富且多样化的对话样本。通过采用“双人巫兹 wizard of Oz”和“自对话”两种采集方式,Taskmaster-1不仅模拟了用户与数字助理之间的真实交互,还引入了口语与书面语的对比维度,使其成为训练端到端对话模型、评估序列到序列架构以及探索对话策略的理想基准。研究者常利用该数据集进行响应生成、API参数预测等核心任务,从而推动对话系统从规则驱动向数据驱动的范式转变。
衍生相关工作
Taskmaster-1数据集衍生了一系列重要的相关工作,显著推动了对话系统研究的前沿。其中,基于该数据集的基线模型如Transformer、LSTM与卷积序列到序列架构被广泛用于对话响应生成与参数预测任务,成为后续模型性能对比的标杆。此外,研究者提出了结合复制机制的Transformer模型,有效提升了API参数预测的准确性。该数据集还催生了对话状态追踪、错误处理分析以及多领域迁移学习等方向的研究,例如探索如何利用自对话数据增强模型对口语不流畅现象的鲁棒性。同时,Taskmaster-1与MultiWOZ的对比分析启发了对对话数据集质量与多样性的深入探讨,促进了更真实、更鲁棒的对话系统评估框架的建立。
数据集最近研究
最新研究方向
在任务导向型对话系统领域,Taskmaster-1数据集的最新研究聚焦于利用其丰富且多样的自然语言交互特性,推动对话模型从规则驱动向数据驱动范式的深度转型。该数据集通过双轨采集策略——即双人“奥兹巫师”口语对话与单人自写对话——突破了传统数据集受限于小规模知识库和刻板脚本的瓶颈,显著提升了对话语料的真实性与复杂性。当前前沿方向包括基于Transformer架构的序列到序列模型在响应生成与API参数预测任务中的基准优化,以及跨领域对话理解中的语义泛化能力探索。此外,该数据集与MultiWOZ等基准的对比分析揭示了其在词汇多样性、实体覆盖率和对话长度上的显著优势,为构建更贴近真实人机交互场景的对话系统提供了关键数据支撑,同时也为口语与书面语差异、纠错机制及话语模式等语言现象的研究开辟了新的实验路径。
相关研究论文
  • 1
    Taskmaster-1: Toward a Realistic and Diverse Dialog Dataset谷歌有限责任公司,山景城,加利福尼亚 · 2019年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作