llama2-hallucination-hidden-states
收藏Hugging Face2026-03-16 更新2026-03-20 收录
下载链接:
https://huggingface.co/datasets/ShoaibSSM/llama2-hallucination-hidden-states
下载链接
链接失效反馈官方服务:
资源简介:
LLaMA-2隐藏状态幻觉数据集是一个专门用于研究大型语言模型(LLM)幻觉检测和Transformer可解释性的数据集。该数据集基于LLaMA-2-7B模型在SQuAD v2数据集上进行问答任务时提取的逐层隐藏状态,并结合了结构化的幻觉标签。数据集包含模型生成过程中的完整Transformer隐藏状态、语义相似度分数、LLM-as-a-judge判决结果和混合接地信号。其目标是探索是否能够直接从Transformer的内部表征中检测幻觉。数据集构建流程包括LLaMA-2-7B生成答案、提取每一步的隐藏状态,并通过子串匹配、语义相似度(MiniLM余弦相似度)和LLM-Judge(Mistral-7B-Instruct)进行标注。每个样本包含元数据、模型输出、内部状态和标注信号等信息。数据集适用于线性探测、跨层信号分析、层重要性研究、隐藏状态聚类、表示几何分析等研究场景。数据集采用CC BY-SA 4.0许可协议。
创建时间:
2026-03-02



