D-Humor

Hugging Face2025-09-17 更新2025-09-18 收录

下载链接：

https://huggingface.co/datasets/UVSKKR/D-Humor

下载链接

链接失效反馈

官方服务：

资源简介：

D-HUMOR数据集是一个包含4379个Reddit memes的数据集，这些memes被注释为包含黑暗幽默、目标类别（性别、心理健康、残疾、种族、暴力/死亡和其他）和三级强度评级（轻微、中等、严重）。该数据集旨在促进对多模态内容中黑暗幽默的理解和内容审查，并支持三个子任务：黑暗幽默识别、目标识别和强度分类。

创建时间：

2025-09-11

原始信息汇总

D-HUMOR 数据集概述

数据集基本信息

名称：D-HUMOR (Dark Humor Understanding via Multimodal Open-ended Reasoning)
许可协议：CC BY-NC-ND 4.0
语言：英语
数据规模：1K-10K（4,379个样本）
标签：黑色幽默、多模态表情包理解、大语言模型自评估、表情包、推理增强框架、视觉语言模型、大语言模型

核心贡献

新颖数据集：从Reddit收集的黑色幽默数据集
角色反转自循环优化：通过提示技术使大语言模型从作者角度思考，改善对齐以生成更好的解释
三流交叉推理网络(TCRNet)：开发推理增强框架，增强对黑色幽默内容的理解和处理

支持任务

黑色幽默识别：二分类任务（是/否）
目标识别：六分类任务
- 性别/性相关话题
- 心理健康
- 残疾
- 种族/民族
- 暴力/死亡
- 其他
强度分类：幽默强度级别（轻度1、中度2、重度3）

数据集访问

访问限制：仅限学术和研究用途（非商业使用）
禁止公开重新分发或上传至第三方平台
访问流程：
- 下载并填写D-Humor数据集访问协议（https://drive.google.com/file/d/1rWRuUamn21nNbOUP7703GAFXr8KbjH-Y/view?usp=sharing）
- 填写数据集访问请求表（https://forms.gle/t9ynkpq4XGd8Kp93A）

伦理考虑

敏感内容：包含死亡、暴力、种族、性别、心理健康和残疾相关内容
仅限研究使用：不得用于娱乐或商业目的
上下文偏见：幽默感知具有文化和上下文依赖性
负责任使用：用户必须避免使用此数据集生成有害、冒犯性或误导性内容

引用信息

bibtex @article{kasu2025d, title = {D-HUMOR: Dark Humor Understanding via Multimodal Open-ended Reasoning}, author = {Kasu, Sai Kartheek Reddy and Rehman, Mohammad Zia Ur and Dar, Shahid Shafi and Junghare, Rishi Bharat and Namboodiri, Dhanvin Sanjay and Kumar, Nagendra}, journal = {arXiv preprint arXiv:2509.06771}, year = {2025} }

搜集汇总

数据集介绍

构建方式

在多媒体幽默理解领域，D-Humor数据集通过精心筛选Reddit平台上的公开模因内容构建而成，涵盖了4,379个样本。每个样本均经过多维度人工标注，包括黑暗幽默存在性判断、六大目标类别（性别、心理健康、暴力、种族、残疾及其他）识别以及三级强度评级（轻度、中度、重度）。数据构建过程严格遵循伦理准则，确保敏感内容的合规处理与学术用途的规范性。

特点

该数据集的核心特征体现在其多模态结构与精细化标注体系上。不仅整合了图像与文本的双模态信息，更创新性地引入了大语言模型生成的推理解释，形成三重数据流。黑暗幽默的标注兼具文化语境敏感性与层次化强度区分，为目标识别与强度预测任务提供了细粒度监督信号。数据分布覆盖六类敏感主题，体现了现实网络内容的复杂性与多样性。

使用方法

研究者可通过申请审核流程获取数据集后，依托其三重模态特征开展多任务学习。文本模态可采用BERT编码器处理OCR转录内容，视觉特征通过Vision Transformer提取，而推理流则利用句子Transformer编码生成的解释文本。Tri-stream Cross-Reasoning Network架构通过跨注意力机制实现多模态融合，支持黑暗幽默检测、目标分类和强度预测三项核心任务。使用过程中需严格遵守伦理规范，确保研究仅限于学术场景。

背景与挑战

背景概述

在数字媒体时代，网络迷因作为一种文化传播形式日益凸显其社会影响力，其中黑色幽默以其隐晦性、敏感性和文化依赖性成为多模态理解的研究难点。D-Humor数据集由研究团队于2025年构建，旨在填补多模态黑色幽默检测领域的资源空白。该数据集包含4,379个Reddit平台采集的迷因样本，标注了黑色幽默存在性、目标类别（涉及性别、心理健康、种族等六类）及强度等级。其核心研究问题聚焦于通过多模态开放推理机制解析黑色幽默的隐含逻辑，为内容审核与文化计算提供理论基础，推动了多模态自然语言处理与视觉语言模型的交叉研究。

当前挑战

黑色幽默理解面临双重挑战：领域层面，其高度依赖文化语境与隐性逻辑，模型需克服语义模糊性与伦理敏感性；构建层面，数据标注需平衡主观性与一致性，且Reddit平台内容的敏感性与多样性要求严格的伦理审查与访问控制。此外，多模态融合中视觉与文本特征的异构性增加了模型建模难度，需开发新型推理架构以实现跨模态对齐。

常用场景

经典使用场景

在多媒体内容理解领域，D-Humor数据集被广泛用于探索暗黑幽默的识别与解析机制。研究者通过该数据集训练多模态模型，使其能够同时处理图像与文本信息，识别含有敏感主题的幽默表达。典型应用包括对网络迷因进行暗黑幽默检测、目标分类及强度分级，为深入理解文化语境下的幽默表达提供数据支撑。

解决学术问题

该数据集有效解决了多模态幽默理解中缺乏标注资源的学术难题，特别是针对暗黑幽默这种依赖隐式文化背景的复杂现象。通过提供精细的注释框架，包括目标类别与强度分级，它支持了敏感内容检测、文化偏见分析以及多模态推理模型的发展，推动了负责任人工智能在内容审核领域的研究进展。

衍生相关工作

基于该数据集衍生的经典工作包括角色反转自循环提示技术，通过大型语言模型模拟作者视角生成解释；以及三流交叉推理网络（TCRNet），创新性地融合文本、图像与推理特征。这些方法为多模态理解任务设立了新基准，并激发了后续关于模型对齐机制和敏感内容处理的研究方向。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集