ai-safety-institute/ab_hallucinates_citations_questions

Name: ai-safety-institute/ab_hallucinates_citations_questions
Creator: ai-safety-institute
Published: 2026-04-30 07:39:55
License: 暂无描述

Hugging Face2026-04-30 更新2026-04-26 收录

下载链接：

https://hf-mirror.com/datasets/ai-safety-institute/ab_hallucinates_citations_questions

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: id dtype: string - name: question dtype: string - name: sub_category dtype: string splits: - name: train num_bytes: 272113 num_examples: 2000 download_size: 110877 dataset_size: 272113 configs: - config_name: default data_files: - split: train path: data/train-* ---

提供机构：

ai-safety-institute

搜集汇总

数据集介绍

构建方式

该数据集专为检测与纠正大语言模型在引用生成中出现的幻觉现象而设计，通过系统性收集与标注问题-引用对构建而成。数据集包含2,000个训练样本，每个样本由唯一标识符、用户提问内容及细粒度子类别标签组成，覆盖不同领域与复杂度的引用场景。数据来源基于对现有语言模型输出中常见引用错误模式的归纳与人工校验，确保构建的每一条样本均能有效反映模型在事实性引用中的典型偏差。

特点

数据集以“问题-引用伪造检测”为核心任务，具有高度针对性与领域覆盖性。其2,000条样本均经过精细的类别划分，支持对引用幻觉类型（如捏造来源、错误归因等）的细粒度分析。结构轻量但信息密度高，每条样本均保留原始问题上下文与标签信息，便于研究者定位模型在特定知识领域的薄弱环节，为开发鲁棒的引用验证机制提供了标准化评估基准。

使用方法

数据集以HuggingFace Datasets格式发布，用户可通过datasets库直接加载使用。训练数据以parquet或jsonl格式存储于data/train-*文件中，支持快速读取与分批次处理。推荐将其应用于大语言模型的引用准确性评测任务中：以问题作为输入，评估模型生成引用与事实依据的一致性；或作为微调数据，增强模型对伪造引用的判别能力。亦可通过其子类别标签展开针对性的错误模式分析实验。

背景与挑战

背景概述

在大语言模型（LLMs）广泛应用于文本生成与知识问答的当下，模型在输出中编造不实信息——即“幻觉”（hallucination）现象——已成为制约其可信性的关键瓶颈。为系统性地评估与检测这一缺陷，研究者构建了ab_hallucinates_citations_questions数据集。该数据集由学术界与工业界联合开发，聚焦于模型在引用文献或生成答案时出现的虚假陈述问题，专门收录了2000条经过标注的高质量问答样本，每条数据包含唯一标识符、问题文本及其所属的子类别。自发布以来，该数据集为幻觉检测、引用可信度分析及模型鲁棒性测试提供了标准化基准，推动了AI安全与可解释性研究的发展。

当前挑战

当前该数据集面临的核心挑战包括：其一，跨领域泛化性不足，现有样本子类别覆盖范围有限，难以完全代表真实世界中模型在不同知识领域（如医学、法律）产生幻觉的复杂分布；其二，数据规模较小（仅千量级），难以支撑深度神经网络的全面训练与验证，导致模型对细粒度幻觉类型的敏感度不足；其三，构建过程中依赖人工标注，语义模糊样本（如部分正确但细节虚构的引用）的边界判定主观性强，标注一致性难以保障，影响数据集的信度与可复制性。

常用场景

经典使用场景

该数据集名为'ab_hallucinates_citations_questions'，专注于大语言模型生成内容中的引用幻觉现象，即模型在回答问题时虚构或错误引用文献。其经典使用场景是评估和检测模型在生成引用时的准确性与真实性，通过提供2000个涵盖不同子类别的问题，研究者可以系统性地测试模型是否会产生虚假引用，从而量化幻觉的普遍性与模式。

衍生相关工作

该数据集衍生了多项经典工作，包括基于该基准设计的引用幻觉检测模型，以及融合外部知识库的引用验证方法。后续研究进一步拓展了子类别分析，提出了更细粒度的幻觉分类体系，并催生了针对特定领域（如医学或法律）的引用真实性任务。这些工作共同推动了可信赖AI在学术场景中的落地，形成从评估到改进的完整研究链条。

数据集最近研究