five

ConvAI2 (Conversational Intelligence Challenge 2)

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/ConvAI2
下载链接
链接失效反馈
官方服务:
资源简介:
ConvAI2 NeurIPS 竞赛旨在寻找方法来创建能够进行有意义的开放域对话的高质量对话代理。用于训练模型的 ConvAI2 数据集基于 PERSONA-CHAT 数据集。每个说话者对都分配了来自一组 1155 个可能的角色(在训练时)的配置文件,每个角色至少包含 5 个配置文件句子,留出 100 个以前从未见过的角色进行验证。随着最初的 PERSONA-CHAT 测试集发布,一个新的隐藏测试集由 100 个新角色和超过 1,015 个对话由众包工作者创建。为了避免利用琐碎的单词重叠进行建模,对相同的训练和测试角色的额外重写集进行了众包,相关的句子是改写、概括或专业化,使任务更具挑战性。例如,“我刚做完指甲”被修改为“我喜欢定期宠爱自己”,“我现在正在节食”被修改为“我需要减肥”。训练集、验证集和隐藏测试集分别由 17,878、1,000 和 1,015 个对话组成。
提供机构:
OpenDataLab
创建时间:
2022-08-16
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作