Interview
收藏arXiv2020-04-07 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2004.03090v1
下载链接
链接失效反馈官方服务:
资源简介:
Interview是一个大规模的开源媒体对话数据集,由加州大学圣地亚哥分校计算机科学与工程学院创建。该数据集包含105,848个对话,总计3,199,856个对话轮次,来源于新闻采访的转录。数据集不仅规模庞大,而且每个对话轮次都标注了说话者角色,有助于开发响应性强、参与度高的对话系统。Interview数据集特别适用于模拟真实世界对话,尤其是在需要特定说话者角色的场景,如医患访谈或主持的脱口秀。此外,数据集还探索了媒体对话中的角色建模和角色变化检测任务,展示了其在复杂开放领域对话建模中的应用潜力。
提供机构:
加州大学圣地亚哥分校计算机科学与工程学院
创建时间:
2020-04-07



