QAConv
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/QAConv
下载链接
链接失效反馈官方服务:
资源简介:
QAConv 是一个新的问答 (QA) 数据集,它使用对话作为知识源。我们专注于内容丰富的对话,包括商务电子邮件、小组讨论和工作渠道。与开放域对话和面向任务的对话不同,这些对话通常是冗长、复杂、异步的,并且涉及强大的领域知识。我们总共收集了 34,204 个 QA 对,包括基于跨度的、自由形式的和无法回答的问题,来自 10,259 个选定的对话,其中既有人工编写的问题,也有机器生成的问题。我们将长对话分割成块,并使用问题生成器和对话摘要器作为辅助工具来收集多跳问题。该数据集有两种测试场景,块模式和完整模式,具体取决于是否提供了接地块或从大型会话池中检索。
提供机构:
OpenDataLab
创建时间:
2022-06-28
搜集汇总
数据集介绍

背景与挑战
背景概述
QAConv是一个问答数据集,以商务邮件和小组讨论等复杂对话为知识源,包含超过3.4万个问答对,涵盖多种问题类型。它提供块模式和完整模式两种测试场景,由学术机构于2022年发布。
以上内容由遇见数据集搜集并总结生成



