PRESTO
收藏arXiv2023-03-17 更新2024-06-21 收录
下载链接:
https://github.com/google-research-datasets/presto
下载链接
链接失效反馈官方服务:
资源简介:
PRESTO数据集是由谷歌公司创建的,包含超过55万条多语言真实任务导向对话,旨在解决现有数据集在捕捉用户痛点方面的不足。该数据集包含多种挑战,如不流畅性、代码切换和用户修正,这些都是在自然语言理解任务中常见的现象。PRESTO数据集不仅包含真实的多语言对话,还提供了结构化上下文,如用户的联系人和列表,以增强对话的真实性。数据集的应用领域广泛,主要用于研究和改进虚拟助手的对话解析能力。
提供机构:
谷歌公司
创建时间:
2023-03-16



