UR-FUNNY
收藏arXiv2019-04-14 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/1904.06618v1
下载链接
链接失效反馈官方服务:
资源简介:
UR-FUNNY是一个用于理解幽默的多模态语言数据集,由罗切斯特大学和CMU的研究团队创建。该数据集包含8257个幽默和非幽默的实例,涵盖文本、视觉和声学三种模态。数据来源于TED演讲视频,通过分析演讲者的语言、表情和声音来识别幽默。创建过程中,研究者利用了TED视频的转录和观众反应标记,提取了幽默的上下文和关键点。UR-FUNNY数据集的应用领域主要集中在自然语言处理中,旨在通过多模态分析解决幽默识别的问题。
UR-FUNNY is a multimodal language dataset for humor understanding, developed by research teams from the University of Rochester and CMU. This dataset contains 8257 humorous and non-humorous instances, covering three modalities: text, vision and acoustics. The data is sourced from TED talk videos, where humor is identified by analyzing the speaker’s language, facial expressions and vocal features. During the dataset construction, researchers utilized the transcripts and audience reaction tags of TED videos to extract humorous contexts and key points. The UR-FUNNY dataset is mainly applied in the field of natural language processing, aiming to solve the problem of humor recognition through multimodal analysis.
提供机构:
计算机科学系,罗切斯特大学,美国;语言技术研究所,SCS,CMU,美国
创建时间:
2019-04-14
搜集汇总
数据集介绍

构建方式
UR-FUNNY 数据集的构建旨在探索幽默表达的多模态语言动态。研究者从 TED 演讲中收集了 1866 个视频及其字幕,利用观众笑声标记来识别幽默的“哏”句,并提取其前的句子作为背景信息。通过强制对齐,确保了文本、音频和视频在单词级别上的同步。此外,数据集还包含了丰富的说话者和话题多样性,涵盖了从科技到日常生活的广泛领域。
特点
UR-FUNNY 数据集的独特之处在于其多模态特性,它包含了文本、视觉和音频三种模态的信息,为理解幽默表达提供了全面的数据支持。数据集还采用了挑战性的负样本选择策略,即从同一视频中随机选择非幽默的句子,确保了数据集的平衡性。此外,数据集还提供了详细的统计信息,包括哏句和背景句的长度、数量和持续时间分布,以及话题的多样性。
使用方法
使用 UR-FUNNY 数据集进行幽默检测时,可以采用多种模型和策略。研究者提出了一种基于上下文记忆融合网络(C-MFN)的模型,该模型考虑了哏句和背景信息,并通过自注意力机制学习模态间的时空关系。此外,还可以使用传统的基于文本的模型、基于视觉的模型或基于音频的模型,以及将多种模态信息融合的模型。在使用数据集时,需要根据具体任务和模型选择合适的数据预处理方法和特征提取方法。
背景与挑战
背景概述
幽默是人类社会交往中一种独特的创造性沟通行为,它通过语言(文本)、手势(视觉)和语调(声音)等多种模态表达。理解幽默的研究长期以来一直是自然语言处理(NLP)领域的一个活跃领域。然而,在多模态环境下,幽默检测的研究相对较少。为了推动这一领域的研究,Md Kamrul Hasan等人于2019年创建了UR-FUNNY数据集,这是一个用于理解幽默的多模态语言数据集。该数据集由美国罗切斯特大学计算机科学系和卡内基梅隆大学语言技术研究所的研究人员共同开发,旨在为自然语言处理社区提供一个多模态幽默检测的框架。UR-FUNNY数据集包含来自TED演讲的视频、音频和文本模态,为研究幽默的表达和理解提供了一个丰富的资源。
当前挑战
UR-FUNNY数据集的研究背景中存在几个关键挑战。首先,幽默的表达具有个体独特性,幽默的人往往也是最富有创造力的人。这种创造力使得幽默的表达方式变得复杂多变。其次,幽默的表达通常依赖于上下文,幽默的发展往往随着时间的推移而逐渐展开,需要分析语境才能充分理解。此外,UR-FUNNY数据集的构建过程中也面临着一些挑战,例如如何有效地从TED演讲中提取幽默的实例,以及如何确保数据集的多样性和平衡性。此外,多模态数据集的构建需要考虑如何整合不同模态的信息,并设计有效的特征提取和融合方法。这些挑战对于推动多模态幽默检测的研究具有重要意义。
常用场景
经典使用场景
在自然语言处理领域,理解幽默一直是极具挑战性的任务。UR-FUNNY数据集的推出为这一领域带来了新的视角。该数据集包含了来自TED演讲的视频、音频和文本数据,旨在帮助研究者构建能够理解幽默的多模态语言模型。通过分析演讲者的话语、手势和声音,模型能够学习到幽默是如何通过多种方式表达的。UR-FUNNY数据集的经典使用场景是训练机器学习模型,使其能够识别和预测演讲中的幽默元素,从而为幽默的自动检测和生成提供支持。
衍生相关工作
UR-FUNNY数据集的推出催生了一系列相关的研究工作。例如,研究者们利用该数据集开发出了基于多模态记忆融合网络(C-MFN)的幽默检测模型,并通过实验验证了该模型的有效性。此外,UR-FUNNY数据集也被用于研究幽默在不同模态中的表达方式和相互作用,从而为幽默的自动生成和理解提供了新的理论和方法。
数据集最近研究
最新研究方向
UR-FUNNY数据集作为多模态语言理解幽默的框架,开辟了自然语言处理领域的新方向。该数据集整合了文本、视觉和音频三种模态,为幽默检测提供了丰富的语料库。研究重点在于探索多模态信息融合技术,如何有效地结合不同模态的特征来提高幽默检测的准确率。此外,该数据集还挑战了现有模型在幽默理解上的局限性,推动了对幽默表达动态性和复杂性的深入研究。
相关研究论文
- 1UR-FUNNY: A Multimodal Language Dataset for Understanding Humor计算机科学系,罗切斯特大学,美国;语言技术研究所,SCS,CMU,美国 · 2019年
以上内容由遇见数据集搜集并总结生成



