nuriasane/llm-hallucination-detection

Name: nuriasane/llm-hallucination-detection
Creator: nuriasane
Published: 2026-04-30 14:13:39
License: 暂无描述

Hugging Face2026-04-30 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/nuriasane/llm-hallucination-detection

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含三个主要特征：question（问题）、answer（答案）和label（标签），其中label是一个类别标签，包含三个类别：factual（事实）、partial（部分）和hallucination（幻觉）。数据集分为train（训练）和test（测试）两个部分，每个部分都有具体的字节数和示例数。下载大小和数据集大小也已提供。

The dataset contains three main features: question, answer, and label, where label is a class label with three categories: factual, partial, and hallucination. The dataset is divided into train and test splits, with specific numbers of bytes and examples for each. The download and dataset sizes are also provided.

提供机构：

nuriasane

搜集汇总

数据集介绍

构建方式

该数据集聚焦于大语言模型在文本生成中可能出现的幻觉现象，旨在为模型输出的真实性评估提供基准。数据集的构建基于精心设计的问答对，其中每个样本包含一个用户提出的问题与大语言模型生成的回答。通过人工标注的方式，将回答划分为三类标签：真实（factual）、部分真实（partial）与完全幻觉（hallucination），从而实现对模型输出质量的精细刻画。数据集规模精简，训练集包含167个样本，测试集包含42个样本，便于快速迭代与评估。

特点

该数据集的核心特点在于其针对性的标签体系，不仅区分了完全真实与完全幻觉的极端情况，还引入了中间状态的“部分真实”类别，这使得对于模型行为的诊断更加细腻。此外，数据集规模较小，适用于快速原型验证与基线测试，降低了研究者的入门门槛。其简洁的字段设计——仅包含问题、回答与标签——使得数据易于理解与使用，避免了冗余信息带来的干扰。

使用方法

该数据集的使用方法直观便捷，支持通过HuggingFace Datasets库直接加载，只需调用`load_dataset`函数指定配置名称即可获取训练与测试分割。典型应用场景包括训练二分类或多分类模型以检测幻觉，或作为评估指标对生成式语言模型进行压力测试。由于数据量有限，研究者可将其作为小样本学习的基准，或结合其他大规模数据集进行迁移学习研究。

背景与挑战

背景概述

随着大型语言模型（LLMs）在自然语言处理领域的广泛应用，模型生成的文本中常出现与事实不符的幻觉现象，严重影响了其在关键任务中的可靠性。为此，llm-hallucination-detection数据集应运而生，旨在系统性地评估和检测模型输出的真实性。该数据集由研究机构于近期构建，包含167条训练样本和42条测试样本，每条样本由问题、回答及标签组成，标签细分为事实性、部分真实与幻觉三类。尽管规模有限，该数据集为幻觉检测研究提供了标准化的基准，推动了相关领域向更可信赖的文本生成方向发展。

当前挑战

该数据集所应对的核心领域挑战在于，大型语言模型生成的内容中幻觉现象普遍存在且难以被现有检测方法有效识别，导致模型在医疗、法律等高风险场景中应用受限。构建过程中，挑战主要体现在三方面：一是需要从海量生成内容中精准标注出幻觉样本，对标注者的领域知识和判断标准要求极高；二是数据集的规模较小，仅167条训练样本与42条测试样本，难以覆盖多样化幻觉类型；三是平衡不同标签类别之间的样本分布，避免因数据不均衡影响检测模型的泛化能力。

常用场景

经典使用场景

在大规模语言模型（LLM）如GPT、LLaMA等蓬勃发展的时代背景下，模型生成文本的真实性评估成为一项至关重要的任务。llm-hallucination-detection数据集正是为此而生，它聚焦于LLM输出中的“幻觉”现象——即模型生成看似合理但实则错误或虚构的信息。该数据集的经典使用场景是作为基准测试集，用于评估和比较不同LLM在事实准确性上的表现。研究者通过输入问题与候选答案，利用其标注的三分类标签（factual、partial、hallucination），系统性地衡量模型对事实的忠实程度，从而揭示各类模型在信息可靠性方面的差异与局限性。

衍生相关工作

基于llm-hallucination-detection数据集，学术界涌现了一系列深化和拓展的研究工作。例如，研究者开发了针对性的检测模型，如基于对比学习或知识图谱增强的幻觉识别架构，显著提升了检测的鲁棒性。同时，该数据集被用于微调指令遵循模型，通过引入负样本（即幻觉回答）进行对抗训练，有效抑制了模型在生成过程中编造事实的倾向。此外，该数据集还催生了跨语言幻觉评估的研究，将其标注模式迁移至多语种场景，并衍生出如Fine-grained Factuality Evaluation等协作基准。这些后续工作不仅验证了原始数据集的基石价值，更推动了幻觉检测从学术探索走向工程化解决方案的成熟化进程。

数据集最近研究