five

KdConv

收藏
魔搭社区2025-11-19 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/KdConv
下载链接
链接失效反馈
官方服务:
资源简介:
displayName: KdConv (Knowledge-driven Conversation) labelTypes: - Chinese Corpus license: - Apache 2.0 mediaTypes: - Text paperUrl: https://arxiv.org/pdf/2004.04100v1.pdf publishDate: "2020" publishUrl: https://github.com/thu-coai/KdConv publisher: - Tsinghua University tags: - Movie - Music - Travel taskTypes: - Data Augmentation - Domain Adaptation --- # 数据集介绍 ## 简介 KdConv 是一个中文多领域知识驱动的对话数据集,将多轮对话中的主题建立在知识图谱上。 KdConv 包含来自三个领域(电影、音乐和旅行)的 4.5K 对话,以及平均转数为 19.0 的 86K 话语。这些对话包含对相关话题的深入讨论和多个话题之间的自然过渡,而语料库也可以用于探索迁移学习和领域适应。 ## 引文 ``` @article{zhou2020kdconv, title={Kdconv: A chinese multi-domain dialogue dataset towards multi-turn knowledge-driven conversation}, author={Zhou, Hao and Zheng, Chujie and Huang, Kaili and Huang, Minlie and Zhu, Xiaoyan}, journal={arXiv preprint arXiv:2004.04100}, year={2020} } ``` ## Download dataset :modelscope-code[]{type="git"}

displayName: KdConv(知识驱动对话,Knowledge-driven Conversation) labelTypes: - 中文语料库(Chinese Corpus) license: - Apache 2.0 mediaTypes: - 文本(Text) paperUrl: https://arxiv.org/pdf/2004.04100v1.pdf publishDate: "2020" publishUrl: https://github.com/thu-coai/KdConv publisher: - 清华大学(Tsinghua University) tags: - 电影(Movie) - 音乐(Music) - 旅行(Travel) taskTypes: - 数据增强(Data Augmentation) - 领域自适应(Domain Adaptation) --- # 数据集介绍 ## 简介 KdConv(知识驱动对话,Knowledge-driven Conversation)是一款面向多轮知识驱动对话的中文多领域对话数据集,其多轮对话的主题均依托知识图谱构建。该数据集涵盖电影、音乐、旅行三大领域的4.5千组对话,总计8.6万条会话话语,单轮对话平均包含19.0个回合。此类对话既包含对相关主题的深入探讨,也实现了多话题间的自然过渡,可用于探索迁移学习与领域自适应研究。 ## 引文 @article{zhou2020kdconv, title={Kdconv: A chinese multi-domain dialogue dataset towards multi-turn knowledge-driven conversation}, author={Zhou, Hao and Zheng, Chujie and Huang, Kaili and Huang, Minlie and Zhu, Xiaoyan}, journal={arXiv preprint arXiv:2004.04100}, year={2020} } ## 数据集下载 :modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-02
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
KdConv是一个中文多领域知识驱动对话数据集,包含电影、音乐和旅行三个领域的4.5K个对话,共计86K个话语,平均每轮对话19.0个话语,适用于探索迁移学习和领域适应。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作