SSD_PLATE (Sub-Slot Dialogue dataset license plate number domain)
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/SSD_PLATE
下载链接
链接失效反馈官方服务:
资源简介:
可以通过对话中的多轮交互逐段提供槽值,尤其是对于一些重要信息,例如电话号码和姓名。这是日常生活中普遍存在的现象,但在以往的工作中却很少关注。为了填补这一空白,本文定义了一个名为基于子槽的面向任务的对话(SSTOD)的新任务,并构建了一个中文对话数据集SSD,以促进对SSTOD的研究。该数据集包括来自四个不同领域的总共 40K 对话和 500K 话语:中文姓名、电话号码、身份证号码和车牌号码。数据用子槽值、槽值、对话状态和动作进行了很好的注释。我们在 SSTOD 中发现了一些新的语言现象和交互方式,这对为任务构建对话代理提出了严峻挑战。我们在 SSTOD 上测试了三个最先进的对话模型,发现它们无法在四个域中的任何一个域上很好地处理任务。我们还通过以插件方式涉及槽知识来研究改进的模型。应该做更多的工作来应对在现实生活中广泛存在的 SSTOD 提出的新挑战。
提供机构:
OpenDataLab
创建时间:
2022-09-01



