HDMBENCH

Name: HDMBENCH
Creator: AIMon Labs
Published: 2025-04-10 01:39:41
License: 暂无描述

arXiv2025-04-10 更新2025-04-11 收录

下载链接：

https://github.com/aimonlabs/hallucination-detection-model

下载链接

链接失效反馈

官方服务：

资源简介：

HDMBENCH是一个新的数据集，由AIMon Labs创建，用于评估语言模型在企业和常见知识背景下的虚构检测。该数据集包含针对大型语言模型输出的虚构响应，特别是基于上下文和常见知识的虚构。它旨在解决企业环境中对准确性和可靠性的高要求，以及虚构内容可能引起的法律风险、合规问题和对用户信任的侵蚀。数据集的具体内容、创建过程和应用领域在论文中未详细描述。

HDMBENCH is a novel dataset created by AIMon Labs for evaluating hallucination detection in large language models (LLMs) under enterprise and general knowledge contexts. This dataset includes hallucinatory responses within the outputs of large language models, specifically those based on contextual information and general knowledge. It aims to address the high demands for accuracy and reliability in enterprise environments, as well as the legal risks, compliance issues, and erosion of user trust that hallucinatory content may induce. The specific content, creation process, and application domains of the dataset are not described in detail in the paper.

提供机构：

AIMon Labs

创建时间：

2025-04-10

搜集汇总

数据集介绍

构建方式

HDMBENCH数据集的构建采用了多阶段流水线方法，以确保覆盖企业环境中多样化的幻觉类型。研究团队首先从RAGTruth上下文、企业支持票据、MS Marco段落、SQuAD问题以及Red Pajama v2等来源收集了约50,000份上下文文档。随后，利用google/gemma-2-9b-it模型生成多样化的问题，包括细节导向型、摘要型和信息寻求型问题。响应生成阶段则采用了多种模型（如Mistral-7B、Qwen2.5-7B等），并通过精心设计的提示语在严格事实性和控制幻觉注入之间交替，以确保风格和错误类型的多样性。标注过程则通过DeepSeek R1模型对每个生成的响应进行短语级标注，包括上下文支持、常识支持或幻觉三类，并辅以推理理由和显式跨度识别。最后，经过严格的过滤和质量控制，包括人工验证，确保了数据集的平衡性和高质量。

使用方法

HDMBENCH数据集的使用方法主要包括模型训练和评估两个主要方面。在训练阶段，研究人员可以利用该数据集对幻觉检测模型进行监督学习，特别是针对上下文和常识幻觉的检测任务。数据集提供的细粒度标注（如短语级标签和推理理由）可用于多任务学习，提升模型的检测精度。在评估阶段，HDMBENCH可用于测试模型在不同幻觉类型上的性能，特别是在企业环境中的实际应用场景。此外，数据集还支持模块化部署，用户可以根据具体需求选择性地启用或禁用特定类型的幻觉检测组件。通过公开的模型权重和推理代码，用户可以快速集成HDMBENCH到现有系统中，以实现高效的幻觉检测和分析。

背景与挑战

背景概述

HDMBENCH数据集由AIMon Labs的研究团队于2025年推出，旨在解决大型语言模型（LLM）在企业应用中的幻觉检测问题。该数据集由Bibek Paudel、Alexander Lyzhov、Preetam Joshi和Puneet Anand等研究人员开发，专注于上下文知识和常识性幻觉的识别。其核心研究问题是通过细粒度的标注和多任务架构，提升企业环境下LLM输出的可信度。HDMBENCH的推出填补了现有基准（如RagTruth和TruthfulQA）在企业场景中的空白，为幻觉检测模型的开发与评估提供了重要资源。

当前挑战

HDMBENCH面临的挑战主要体现在两方面：领域问题方面，需解决企业环境中幻觉类型的多样性（如上下文矛盾、常识错误、专有知识缺失等），同时需平衡检测精度与计算效率；构建过程方面，需确保50,000条语料的标注一致性，并处理多模型生成响应的风格差异。此外，如何将专有知识整合到通用检测框架中，以及降低对生成模型内部状态的依赖，均为技术难点。

常用场景

经典使用场景

HDMBENCH数据集在大型语言模型（LLM）幻觉检测领域具有重要应用价值。该数据集通过精心设计的上下文收集、问题生成和响应标注流程，为研究者提供了丰富的多类型幻觉样本。其最经典的使用场景是评估和比较不同幻觉检测模型的性能，特别是在企业级应用中。研究人员可以利用HDMBENCH对模型进行端到端测试，验证其在上下文一致性、常识验证和企业专有知识识别等方面的表现。

解决学术问题

HDMBENCH有效解决了LLM幻觉检测领域的多个关键学术问题。首先，它填补了现有基准数据集在企业级场景下的空白，提供了针对上下文型、常识型和企业专有知识型幻觉的细粒度标注。其次，该数据集支持对幻觉检测模型的模块化评估，允许研究者单独测试模型在不同类型知识验证上的表现。最重要的是，HDMBENCH促进了幻觉检测领域从单一维度向多维度评估的转变，为建立更全面的评估体系奠定了基础。

实际应用

在实际应用中，HDMBENCH数据集为企业部署可信赖的LLM系统提供了重要支持。企业可以利用该数据集训练和优化幻觉检测模型，确保客户服务、法律合规和内容生成等关键应用的输出准确性。特别是在高风险的金融、医疗和法律领域，基于HDMBENCH开发的检测系统能够显著降低由模型幻觉引发的合规风险和诉讼隐患。此外，该数据集还支持构建企业知识库的持续更新机制，帮助组织保持AI系统与最新知识的同步。

数据集最近研究