five

LCCC

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/thu-coai/cdial-gpt
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个大规模的中文对话数据集,经过清洗,包含基础版的680万条对话以及大型版的1200万条对话。这些高质量的数据被用于提升通用任务导向对话系统之间的互动性。该数据集的规模分别为基础版的680万条对话和大型版的1200万条对话,适用于开放领域聊天机器人的开发任务。

This is a large-scale, cleaned Chinese dialogue dataset that includes two variants: a basic version with 6.8 million dialogues and a large version with 12 million dialogues. These high-quality data are utilized to enhance the interactivity of general task-oriented dialogue systems. With the stated scale, this dataset is suitable for the development of open-domain chatbots.
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作