Language-Vision-Hallucinations

Hugging Face2024-11-01 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/wrom/Language-Vision-Hallucinations

下载链接

链接失效反馈

官方服务：

资源简介：

Techen项目095280的综合数据集，专注于通过研究模型不确定性、文本生成模式和语言因素来检查多模态AI生成文本中的幻觉。数据集包含图像链接、生成文本的温度设置、模型生成的描述、原始token logits、数据收集组标识、数据集分割、语言-视觉模型处理描述时的token logits等字段。此外，数据集还包含幻觉和语言因素的详细信息，以及用于分析模型预测的探针和上下文数据。

创建时间：

2024-11-01

原始信息汇总

Language-Vision-Hallucinations 数据集概述

数据集描述

该数据集是为Techen项目（项目编号095280）设计的综合数据集，专注于研究多模态AI生成文本中的幻觉现象。通过调查模型的不确定性、文本生成模式和语言因素，深入分析幻觉现象。

数据集结构

列概述

image_link: 与每行数据关联的图像URL。
temperature: 文本生成时的温度设置，控制输出的随机性。
description: 模型为每个图像生成的文本描述，使用提示："USER: <image> Please provide a thorough description of this image ASSISTANT:"。
logits: 模型为每个输出生成的原始token logits（概率）。
group_num: 数据收集的组标识符。
- Group 4: 使用"llava-hf/llava-v1.6-mistral-7b-hf"。
- Group 5: 使用"llava-hf/llava-1.5-7b-hf"。
split: 数据集分割（训练集、开发集、测试集）。
raw_language_logits: 描述在语言-视觉模型中处理时（LLM模式）的token logits，不包含图像。

幻觉和语言因素

hallucinations: 完整描述文本，幻觉细节用方括号[ ]高亮。
hedges: 完整描述文本，不确定性语言（如“可能”、“或许”）用方括号[ ]高亮。

探针和上下文数据

每个探针（1到4）包含用于分析模型预测的数据字段，至少有一个探针专注于描述中的幻觉现象。

probe_X: 给模型的特定查询或提示。
label_X: 与探针对应的ground truth标签。
pred_X: 模型基于探针的预测。
context_X: 完整描述文本，相关上下文细节用方括号[ ]高亮。
textual_logitX: 描述生成时上下文派生token的logits。
desc_logitX: 描述在LLM模式下反馈给模型时的logits。

数据集用途

该数据集支持对模型生成语言、不确定性测量以及AI生成内容中幻觉检测的深入分析。

搜集汇总

数据集介绍

构建方式

该数据集围绕多模态AI生成文本中的幻觉现象展开研究，通过模型不确定性、文本生成模式和语言因素等多维度进行构建。数据采集过程中，使用了不同的温度设置来控制文本生成的随机性，并基于特定提示生成图像描述。数据集包含多个组别，分别采用不同的模型进行数据生成，如`llava-hf/llava-v1.6-mistral-7b-hf`和`llava-hf/llava-1.5-7b-hf`。此外，数据集还通过探针和上下文数据字段，深入分析模型预测的多样性和幻觉检测的准确性。

特点

该数据集的核心特点在于其对多模态AI生成文本中幻觉现象的细致标注与分析。数据集不仅提供了图像链接、生成文本和原始token logits等基础信息，还特别标注了幻觉内容和不确定性语言，如使用方括号`[ ]`高亮显示幻觉细节和模糊表达。此外，数据集通过多个探针字段，支持对模型预测的上下文相关性和语言生成逻辑的深入分析。这些特点使得该数据集成为研究AI生成文本幻觉现象的重要资源。

使用方法

该数据集适用于多模态AI生成文本的幻觉检测、模型不确定性分析以及语言生成模式研究。用户可以通过数据集中的图像链接和生成文本，结合标注的幻觉内容和不确定性语言，进行幻觉现象的定量与定性分析。探针字段和上下文数据则为用户提供了多角度的模型预测分析工具，支持对生成文本的上下文依赖性和语言逻辑的深入探讨。数据集的分割（train, dev, test）也为模型的训练与评估提供了便利。

背景与挑战

背景概述

Language-Vision-Hallucinations数据集由Techen Project 095280项目团队创建，旨在深入探究多模态AI生成文本中的幻觉现象。该数据集通过分析模型不确定性、文本生成模式及语言因素，揭示了AI在图像描述任务中的表现与局限。数据集的核心研究问题聚焦于如何有效检测和量化生成文本中的幻觉内容，为提升多模态模型的可靠性与准确性提供了重要数据支持。该数据集自发布以来，已在自然语言处理与计算机视觉交叉领域引起了广泛关注，推动了相关技术的进一步发展。

当前挑战

Language-Vision-Hallucinations数据集在解决多模态AI生成文本幻觉检测问题时，面临诸多挑战。首先，幻觉现象的多样性与复杂性使得其定义与量化变得困难，需要设计精细的标注与评估方法。其次，构建过程中需平衡数据规模与标注质量，以确保数据集的代表性与可靠性。此外，多模态数据的融合与对齐问题也对数据集的构建提出了更高要求，尤其是在图像与文本的关联性分析中，如何准确捕捉模型生成文本的偏差与不确定性仍需进一步探索。这些挑战不仅影响了数据集的构建效率，也对后续研究的深度与广度提出了更高要求。

常用场景

经典使用场景

在人工智能领域，多模态生成模型的研究日益深入，Language-Vision-Hallucinations数据集为研究者提供了一个独特的视角，用于分析模型在生成文本时的不确定性和幻觉现象。通过结合图像和文本数据，研究者能够深入探讨模型在不同温度设置下的生成行为，以及语言因素对生成结果的影响。

衍生相关工作

基于Language-Vision-Hallucinations数据集，研究者们已经开展了一系列经典工作。例如，有研究利用该数据集开发了新的幻觉检测算法，显著提高了多模态生成模型的生成质量。此外，该数据集还催生了多篇关于模型不确定性和语言因素影响的学术论文，推动了多模态生成模型领域的进一步发展。

数据集最近研究