D-HUMOR

Name: D-HUMOR
Creator: 印度理工学院英多尔分校
Published: 2025-09-08 22:55:16
License: 暂无描述

arXiv2025-09-08 更新2025-09-10 收录

下载链接：

https://github.com/Sai-Kartheek-Reddy/D-Humor-Dark-Humor-Understanding-via-MultimodalOpen-ended-Reasoning

下载链接

链接失效反馈

官方服务：

资源简介：

D-HUMOR数据集是一个包含4379个Reddit表情包的全新数据集，这些表情包被标注为黑色幽默、目标类别（性别、心理健康、暴力、种族、残疾和其他）以及三级强度评级（轻微、中等、严重）。该数据集的创建旨在解决在线表情包中黑色幽默检测的资源和方法不足的问题。数据集的收集来源于Reddit，每个表情包都包含图像和OCR提取的文本。标注过程由计算机科学专业的本科生在专家监督下进行，以确保标注质量和一致性。数据集的发布旨在促进对多模态幽默理解和内容审核的进一步研究。

The D-HUMOR dataset is a novel corpus consisting of 4,379 Reddit memes. Each meme is annotated with dark humor labels, target categories (gender, mental health, violence, race, disability, and others), and a three-level intensity rating (mild, moderate, severe). This dataset was constructed to address the gap in resources and methodologies for dark humor detection in online memes. Sourced from Reddit, each entry in the dataset includes both the original image and text extracted via optical character recognition (OCR). The annotation process was conducted by undergraduate computer science students under the supervision of experts, ensuring annotation quality and inter-annotator consistency. The release of the D-HUMOR dataset aims to facilitate further research on multimodal humor understanding and content moderation.

提供机构：

印度理工学院英多尔分校

创建时间：

2025-09-08

搜集汇总

数据集介绍

构建方式

D-HUMOR数据集的构建依托于Reddit平台公开的多模态内容，通过API系统化采集包含图文结合的模因数据，并采用光学字符识别技术提取文本信息。经过严格的人工筛选与去重流程，最终形成包含4,397个样本的高质量语料库。标注过程中采用三级维度体系：黑暗幽默二值判定、六类目标群体分类（性别、心理健康、暴力、种族、残疾及其他）以及三级强度标定（轻度、中度、重度），所有标注均通过专家指导下的多轮训练与仲裁确保一致性。

使用方法

在使用方法上，该数据集支持三类核心任务：黑暗幽默检测的二值分类、目标群体的多分类识别以及强度等级的序数回归。研究人员可通过提取视觉特征（ViT编码器）、文本特征（BERT编码器）并结合论文提出的推理增强机制——即通过Qwen-VLM生成结构化解释并经角色反转自循环优化，最终通过三流交叉推理网络实现多模态特征融合。实验表明引入推理组件能使目标识别宏F1值提升25个百分点，证实了结构化解释对理解隐式幽默语义的重要价值。

背景与挑战

背景概述

D-HUMOR数据集由印度理工学院等机构的研究团队于2025年创建，旨在解决多模态内容中黑色幽默识别的学术空白。该数据集包含4,379个来自Reddit的模因样本，标注了黑色幽默存在性、目标类别（性别、心理健康等六大维度）及三级强度评级。作为首个专注于多模态黑色幽默理解的数据资源，其细粒度标注框架为计算语言学与社会媒体分析提供了关键基础设施，推动了敏感内容检测与情感计算研究的交叉融合。

当前挑战

领域挑战在于黑色幽默依赖文化语境、道德模糊性和多模态语义冲突，传统模型难以捕捉其隐含的讽刺与情感矛盾。构建挑战涉及标注一致性保障：需协调主观性极强的强度评级（Fleiss' Kappa仅58.57），并通过角色反转自循环机制迭代修正大语言模型的推理生成，以克服敏感内容对标注者心理的潜在影响与跨模态对齐的复杂性。

常用场景

经典使用场景

在计算语言学与多模态分析领域，D-HUMOR数据集为黑暗幽默检测提供了关键的研究基础。其经典应用场景集中于社交媒体内容的多模态理解，通过结合图像与文本特征，支持模型识别隐含的讽刺、挖苦等幽默表达形式。该数据集常用于训练和评估多模态机器学习模型，以捕捉文化语境中的敏感语义和情感冲突。

解决学术问题

D-HUMOR数据集解决了多模态幽默理解中的核心学术问题，包括黑暗幽默的自动检测、目标群体识别以及幽默强度预测。其细粒度标注支持对敏感主题（如性别、心理健康）的社会伦理分析，填补了该领域数据资源的空白。通过提供结构化推理信号，数据集促进了模型在隐式语义对齐和跨模态不一致性建模方面的进展，对内容审核与情感计算研究具有深远影响。

实际应用

该数据集的实际应用涵盖社交媒体内容审核、在线社区治理以及心理健康支持系统。通过自动化检测黑暗幽默，平台可有效识别潜在有害内容，减少网络暴力与歧视性传播。此外，在心理与行为研究中，该数据有助于分析幽默表达与用户情感状态之间的关联，为数字人文研究提供实证基础。

数据集最近研究