海天瑞声-超大规模中文多领域高质量多轮对话语料库|自然语言处理数据集|对话系统数据集
收藏魔搭社区2025-12-11 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/haitianruisheng/ChineseMulti-TurnConversationDataset
下载链接
链接失效反馈资源简介:
这是一个符合中国人表达习惯的自然对话数据集,共计约1,0000,000轮,上亿级token,包含正式&非正式风格对话,使用偏口语化自然表达。覆盖工作、生活、校园等场景,及金融、教育、娱乐、体育、汽车、科技等领域。在数据集构成上,DOTS-NLP-216包含了对真实场景的对话采集,及高度还原真实场景的模拟对话这两种方式,兼顾分布的代表性、多样性和样本规模。
提供机构:
maas
创建时间:
2024-06-06
