ubuntu_dialogs_corpus
收藏OpenCSG2024-07-19 更新2026-01-19 收录
下载链接:
https://opencsg.com/datasets/AIWizards/ubuntu_dialogs_corpus?tab=summary
下载链接
链接失效反馈官方服务:
资源简介:
Ubuntu Dialogue Corpus(UDC)是一个包含约100万个多轮对话的数据集,总计超过700万条话语和1亿个单词。它主要用于构建基于神经语言模型的对话管理系统,支持对话生成等任务。数据集中的每个样本包含上下文、回复和标签等字段。该语料库来源于非结构化的多轮对话,适用于研究如何利用大量未标记数据。
提供机构:
AIWizards
创建时间:
2024-07-19



