DuConv
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/DuConv
下载链接
链接失效反馈官方服务:
资源简介:
DuConv是一个基于电影和明星领域的数据集,包括票房、导演、评论等。
数据集由30k个对话组成,大约120k个对话圈。其中20k对话为训练集,2k对话为发展集,8k对话用于构建测试样本。对话框集和开发集中的每个对话框都包含对话框目的、背景知识和对话框详细信息。
DuConv is a dataset targeting the film and celebrity domain, covering box office data, directors, reviews and other related content. It comprises 30,000 dialogues, with approximately 120,000 dialogue turns. Of these, 20,000 dialogues are used as the training set, 2,000 as the development set, and 8,000 dialogues are employed to construct test samples. Each dialogue in the training and development sets includes dialogue purpose, background knowledge and detailed dialogue information.
提供机构:
OpenDataLab
创建时间:
2023-04-20
搜集汇总
数据集介绍

背景与挑战
背景概述
DuConv是一个电影和明星领域的对话数据集,包含30k个对话(约120k对话圈),涵盖票房、导演、评论等信息,每个对话包含目的、背景知识和详细信息。该数据集由百度于2022年8月发布,适用于对话系统研究和开发。
以上内容由遇见数据集搜集并总结生成



