KdConv
收藏魔搭社区2025-11-19 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/KdConv
下载链接
链接失效反馈官方服务:
资源简介:
displayName: KdConv (Knowledge-driven Conversation)
labelTypes:
- Chinese Corpus
license:
- Apache 2.0
mediaTypes:
- Text
paperUrl: https://arxiv.org/pdf/2004.04100v1.pdf
publishDate: "2020"
publishUrl: https://github.com/thu-coai/KdConv
publisher:
- Tsinghua University
tags:
- Movie
- Music
- Travel
taskTypes:
- Data Augmentation
- Domain Adaptation
---
# 数据集介绍
## 简介
KdConv 是一个中文多领域知识驱动的对话数据集,将多轮对话中的主题建立在知识图谱上。 KdConv 包含来自三个领域(电影、音乐和旅行)的 4.5K 对话,以及平均转数为 19.0 的 86K 话语。这些对话包含对相关话题的深入讨论和多个话题之间的自然过渡,而语料库也可以用于探索迁移学习和领域适应。
## 引文
```
@article{zhou2020kdconv,
title={Kdconv: A chinese multi-domain dialogue dataset towards multi-turn knowledge-driven conversation},
author={Zhou, Hao and Zheng, Chujie and Huang, Kaili and Huang, Minlie and Zhu, Xiaoyan},
journal={arXiv preprint arXiv:2004.04100},
year={2020}
}
```
## Download dataset
:modelscope-code[]{type="git"}
displayName: KdConv(知识驱动对话,Knowledge-driven Conversation)
labelTypes:
- 中文语料库(Chinese Corpus)
license:
- Apache 2.0
mediaTypes:
- 文本(Text)
paperUrl: https://arxiv.org/pdf/2004.04100v1.pdf
publishDate: "2020"
publishUrl: https://github.com/thu-coai/KdConv
publisher:
- 清华大学(Tsinghua University)
tags:
- 电影(Movie)
- 音乐(Music)
- 旅行(Travel)
taskTypes:
- 数据增强(Data Augmentation)
- 领域自适应(Domain Adaptation)
---
# 数据集介绍
## 简介
KdConv(知识驱动对话,Knowledge-driven Conversation)是一款面向多轮知识驱动对话的中文多领域对话数据集,其多轮对话的主题均依托知识图谱构建。该数据集涵盖电影、音乐、旅行三大领域的4.5千组对话,总计8.6万条会话话语,单轮对话平均包含19.0个回合。此类对话既包含对相关主题的深入探讨,也实现了多话题间的自然过渡,可用于探索迁移学习与领域自适应研究。
## 引文
@article{zhou2020kdconv,
title={Kdconv: A chinese multi-domain dialogue dataset towards multi-turn knowledge-driven conversation},
author={Zhou, Hao and Zheng, Chujie and Huang, Kaili and Huang, Minlie and Zhu, Xiaoyan},
journal={arXiv preprint arXiv:2004.04100},
year={2020}
}
## 数据集下载
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-02
搜集汇总
数据集介绍

背景与挑战
背景概述
KdConv是一个中文多领域知识驱动对话数据集,包含电影、音乐和旅行三个领域的4.5K个对话,共计86K个话语,平均每轮对话19.0个话语,适用于探索迁移学习和领域适应。
以上内容由遇见数据集搜集并总结生成



