five

MIntRec2.0 多模态意图识别对话数据集

收藏
超神经2024-03-18 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/30166
下载链接
链接失效反馈
资源简介:
MIntRec2.0 是清华大学等提出的一个大规模多模态多方基准数据集,专门用于识别对话中的意图和检测非意图内容。相较于先前的 MIntRec,MIntRec2.0 的数据量增至 15K,涵盖 30 种意图类别,并包含约 9.3K 个意图内及 5.7K 个意图外的标注语句,涉及文本、视频和音频等多种模态。

MIntRec2.0 is a large-scale multimodal multi-party benchmark dataset proposed by Tsinghua University and other institutions, which is specifically designed for intent recognition in conversations and detection of out-of-intent content. Compared with the original MIntRec, MIntRec2.0 has expanded its scale to 15K annotated utterances, covering 30 intent categories. Specifically, it includes approximately 9.3K in-intent utterances and 5.7K out-of-intent utterances, involving multiple modalities such as text, video and audio.
创建时间:
2024-03-18
AI搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
MIntRec2.0是一个大规模多模态多方对话数据集,由清华大学等机构提出,专门用于意图识别和非意图内容检测。该数据集包含15K数据量,涵盖30种意图类别,涉及文本、视频和音频多种模态,并引入OOS标签以处理开放世界场景,旨在推动多模态意图理解研究,为更自然的人机交互奠定基础。
以上内容由AI搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作