HHVD

github2026-04-10 更新2026-04-22 收录

下载链接：

https://github.com/pang-jh/Steering_the_Verifiability

下载链接

链接失效反馈

官方服务：

资源简介：

HHVD是一个人工标注的多模态幻觉可验证性基准数据集，旨在评估用户验证幻觉内容的难易程度，并支持对MLLMs中幻觉控制的细粒度分析。

HHVD is a human-annotated benchmark dataset focused on multimodal hallucination verifiability, aiming to evaluate the difficulty users encounter when verifying hallucinatory content and enable fine-grained analysis of hallucination control in multimodal large language models (MLLMs).

创建时间：

2026-04-03

原始信息汇总

数据集概述

数据集名称

HHVD (Human-annotated benchmark for multimodal hallucination verifiability)

核心目的

该数据集旨在从人类可验证性的角度研究多模态幻觉，用于评估用户验证幻觉内容的难易程度，并支持对多模态大语言模型中幻觉控制的细粒度分析。

关键特性

幻觉类型划分：将幻觉区分为明显幻觉（易于人类发现）和难以察觉的幻觉（人类难以快速验证）。
标注性质：包含人类标注。
设计用途：作为评估基准，支持对幻觉可验证性的细粒度分析。

获取地址

Hugging Face: https://huggingface.co/datasets/BeEnough/HHVD
ModelScope: https://www.modelscope.cn/datasets/Nothing07/HHVD

相关研究

该数据集是研究项目“Steering the Verifiability of Multimodal AI Hallucinations”的一部分。该项目提出了一个激活空间干预框架，学习两种独立的干预方向：

OHI: 明显幻觉干预
EHI: 难以察觉的幻觉干预这些方向用于在推理时引导模型行为，实现对幻觉可验证性的细粒度控制。

搜集汇总

数据集介绍

构建方式

在探索多模态人工智能幻觉的可验证性研究中，HHVD数据集的构建采用了系统化的人工标注流程。研究者首先从多模态大语言模型中收集生成内容，并依据人类验证的难易程度，将幻觉划分为明显幻觉与隐蔽幻觉两类。随后，标注人员基于预定义的准则对每一条数据进行细致标注，确保数据集的科学性与可靠性。这一过程不仅注重数据的多样性与代表性，还通过多轮校验机制保障了标注质量，从而为后续的干预框架提供了坚实的实证基础。

特点

HHVD数据集的核心特点在于其专注于多模态幻觉的可验证性评估，为研究界提供了首个针对人类验证难易程度进行细粒度分析的基准。该数据集涵盖了丰富多样的多模态内容，包括图像与文本的交互生成实例，并依据幻觉的明显与隐蔽性质进行了精确分类。其结构设计支持对多模态大语言模型幻觉行为的深入探究，尤其适用于评估干预策略在控制不同类别幻觉方面的有效性，为相关领域的研究提供了关键的数据支撑。

使用方法

使用HHVD数据集时，研究者可通过提供的代码仓库快速搭建实验环境。首先克隆项目并安装依赖，随后运行指定脚本以启动数据处理流程。数据集支持从多个平台获取，便于集成到现有的多模态评估框架中。用户可以利用该数据集进行幻觉方向提取与选择，进而实施激活空间干预，以细粒度调控模型的幻觉生成行为。这一过程不仅有助于验证干预方法的有效性，还能推动多模态人工智能在可解释性与可控性方面的前沿探索。

背景与挑战

背景概述

随着多模态大语言模型在视觉-语言任务中的广泛应用，模型生成内容中的幻觉问题日益凸显，成为制约其可信度与实用性的关键瓶颈。HHVD数据集由Jianhong Pang、Yu-Gang Jiang等研究人员于2026年构建，旨在从人类可验证性的视角系统研究多模态幻觉现象。该数据集将幻觉划分为明显幻觉与隐蔽幻觉两类，并基于激活空间干预框架，为模型行为提供细粒度控制。其核心研究问题聚焦于如何量化与干预幻觉的可验证性，从而推动多模态人工智能向更可靠、可解释的方向发展，对提升模型安全性与用户体验具有重要影响力。

当前挑战

HHVD数据集所针对的领域挑战在于多模态幻觉的细粒度识别与干预。传统方法往往将幻觉视为单一类别，难以区分其可验证性差异，导致模型输出缺乏可控性。构建过程中的挑战则体现在数据标注的复杂性上：需要设计严谨的人类评估协议，以准确区分明显与隐蔽幻觉，确保标注的一致性与可靠性；同时，数据集需涵盖多样化的视觉-语言场景，以全面反映模型在不同上下文中的幻觉模式，这对数据收集与质量控制提出了较高要求。

常用场景

经典使用场景

在人工智能多模态领域，幻觉现象是模型生成与输入数据不一致内容的关键挑战。HHVD数据集通过人类标注的细粒度注释，为研究者提供了评估多模态大语言模型幻觉可验证性的基准。该数据集常用于训练和验证干预框架，以区分明显幻觉与隐匿幻觉，从而实现对模型生成行为的精细调控，推动幻觉检测与控制方法的发展。

实际应用

在实际应用中，HHVD数据集可用于增强多模态AI系统的可信度，例如在医疗诊断、自动驾驶或内容审核场景中，模型生成的幻觉可能导致严重后果。通过基于该数据集的干预方法，开发者能够调整模型输出，减少难以验证的错误信息，从而提高系统在真实世界任务中的鲁棒性和用户信任度，推动AI技术向更安全、可靠的方向演进。

衍生相关工作

围绕HHVD数据集，衍生了一系列经典研究工作，包括基于激活空间干预的框架开发，如明显幻觉干预与隐匿幻觉干预方向的提取与应用。这些工作扩展了多模态幻觉控制的前沿，促进了后续研究在模型可解释性、细粒度行为调控等方向的探索，为构建更透明、可控的人工智能系统提供了重要参考和实验基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集