Doc2Bot
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/Doc2Bot
下载链接
链接失效反馈官方服务:
资源简介:
Doc2Bot,一种用于构建机器的新颖数据集,可帮助用户通过对话查找信息。这对于拥有大量手册或说明书的公司和组织特别感兴趣。尽管它具有潜力,但我们任务的性质却带来了一些挑战 :( 1) 文档包含各种结构,这些结构阻碍了机器的理解能力,并且 (2) 用户信息需求通常被低估了。与以前专注于单一结构类型或忽略质疑以发现用户需求的作用的数据集相比,Doc2Bot数据集的开发是为了系统地针对此类挑战。我们的数据集包含基于来自五个域的中文文档的100,000多个回合,比任何以前的基于文档的对话数据集都要大,以进行信息搜索。我们在Doc2Bot中提出了三个任务 :( 1) 对话状态跟踪以跟踪用户意图,(2) 对话策略学习以计划系统操作和内容,以及 (3) 响应生成,该响应生成基于对话策略的输出的响应。提出了基于最新深度学习模型的基线方法,表明我们提出的任务具有挑战性,值得进一步研究。
提供机构:
OpenDataLab
创建时间:
2022-11-18



