hallucination_dataset
收藏Hugging Face2024-06-28 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/rafaelsandroni/hallucination_dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集收集了用于训练自然语言推理(NLI)模型以检测幻觉的公共数据集。数据集特征包括用户问题、当前文本、命题、标签(布尔类型)和索引级别(整数类型)。数据集分为训练集,包含95545个样本,主要用于文本分类和句子相似度任务,支持英语和葡萄牙语,标签为幻觉检测和奖励,数据集大小在100K到1M之间。
创建时间:
2024-06-28
原始信息汇总
数据集概述
数据集信息
- 特征列表:
user_question: 字符串类型text_so_far: 字符串类型proposition: 字符串类型label: 布尔类型__index_level_0__: 整数类型
- 数据分割:
train: 包含95545个样本,总大小为464615105字节
- 下载大小:161580320字节
- 数据集大小:464615105字节
配置信息
- 配置名称:default
- 数据文件:
train: 路径为data/train-*
- 数据文件:
任务类别
- 文本分类
- 句子相似度
语言
- 英语
- 葡萄牙语
标签
- 幻觉检测
- 奖励
数据集名称
- Hallucination Detect
数据集大小分类
- 100K<n<1M
搜集汇总
数据集介绍

构建方式
hallucination_dataset的构建基于公开数据集,旨在训练自然语言推理(NLI)模型以检测文本生成中的幻觉现象。数据集通过收集用户提问、生成文本片段、相关命题及其标签,形成了一个包含95,545个样本的训练集。每个样本均标注了命题的真实性,为模型提供了明确的监督信号。
特点
该数据集的特点在于其专注于文本生成中的幻觉检测,涵盖了多种语言环境下的文本片段。数据集包含用户提问、生成文本、相关命题及其标签,形成了一个多维度的文本分类任务。其规模适中,适合用于训练和验证NLI模型,尤其在多语言场景下表现出色。
使用方法
使用该数据集时,研究人员可通过加载训练集进行模型训练,重点关注文本生成中的幻觉检测任务。数据集支持文本分类和句子相似性任务,适用于自然语言推理模型的开发与评估。通过分析用户提问与生成文本之间的关系,模型可学习识别并纠正生成文本中的幻觉现象。
背景与挑战
背景概述
Hallucination Dataset 是一个专注于检测自然语言生成(NLG)系统中幻觉现象的数据集。幻觉现象指的是模型生成的文本虽然流畅且符合语法,但与事实不符或缺乏依据。该数据集由多个公开数据集整合而成,旨在训练自然语言推理(NLI)模型以识别和减少生成文本中的幻觉问题。其创建时间不详,但反映了近年来对生成模型可信度和准确性的日益关注。该数据集的研究背景与生成式人工智能的快速发展密切相关,尤其是在对话系统、机器翻译和文本摘要等领域,幻觉问题已成为影响模型实用性和可靠性的关键挑战。通过提供标注数据,该数据集为研究人员提供了评估和改进生成模型的重要工具。
当前挑战
Hallucination Dataset 面临的主要挑战包括两个方面。首先,在领域问题方面,幻觉检测本身具有高度复杂性,因为幻觉文本通常与真实文本在语法和语义上极为相似,难以通过简单的规则或浅层模型进行区分。这要求模型具备强大的推理能力和对上下文的理解。其次,在数据集构建过程中,如何确保标注的准确性和一致性是一个重要挑战。由于幻觉的定义可能因任务和领域而异,标注者需要具备较高的专业知识,以避免主观偏差。此外,数据集的多样性和覆盖范围也需进一步扩展,以应对不同语言和场景下的幻觉问题。这些挑战共同构成了该数据集在推动生成模型可信度研究中的核心难题。
常用场景
经典使用场景
在自然语言处理领域,hallucination_dataset数据集主要用于训练和评估模型以检测文本生成中的幻觉现象。幻觉现象指的是模型生成的文本虽然流畅,但与事实不符或缺乏逻辑支持。该数据集通过提供用户问题、生成文本片段、命题及其标签,帮助研究人员构建和优化能够识别和纠正幻觉的模型。
实际应用
在实际应用中,hallucination_dataset数据集被广泛应用于智能客服、内容审核和自动新闻生成等场景。通过检测和纠正幻觉,这些系统能够提供更加准确和可信的信息,从而提升用户体验和系统性能。例如,在智能客服中,幻觉检测可以避免提供错误信息,增强用户信任。
衍生相关工作
基于hallucination_dataset,研究人员开发了多种先进的幻觉检测模型,如基于自然语言推理(NLI)的模型和基于深度学习的序列标注模型。这些模型在多个公开评测中取得了显著成果,并推动了幻觉检测技术的发展。此外,该数据集还激发了更多关于文本生成质量评估的研究,为自然语言处理领域的进一步发展提供了重要参考。
以上内容由遇见数据集搜集并总结生成



