five

FactLens

收藏
arXiv2024-11-09 更新2024-11-13 收录
下载链接:
https://drive.google.com/drive/folders/1YSuW3vVfywS766MFqCOnUzksNiPM4h3G
下载链接
链接失效反馈
官方服务:
资源简介:
FactLens数据集由Megagon Labs创建,旨在评估细粒度事实验证。该数据集包含733个实例,来源于CoverBench,涵盖多个领域和来源。数据集通过GPT4o和LLaMA-3.1生成子声明,并经过人工审核以确保高质量。创建过程强调子声明的原子性和语义等价性,确保每个子声明可以独立验证。FactLens主要应用于提高事实验证的精确性和透明度,解决复杂声明中细微错误的识别问题。

The FactLens dataset was developed by Megagon Labs for evaluating fine-grained fact verification. It contains 733 instances sourced from CoverBench, spanning multiple domains and data origins. Sub-claims in the dataset are generated via GPT-4o and LLaMA-3.1, and undergo manual review to ensure high quality. The creation process emphasizes the atomicity and semantic equivalence of sub-claims, enabling independent verification of each individual sub-claim. FactLens is mainly applied to improve the accuracy and transparency of fact verification, addressing the problem of identifying subtle errors in complex claims.
提供机构:
Megagon Labs
创建时间:
2024-11-09
搜集汇总
数据集介绍
main_image_url
构建方式
FactLens数据集的构建基于对复杂声明进行细粒度验证的需求。该数据集通过手动筛选和专家注释确保高质量的子声明生成。具体而言,研究团队从CoverBench数据集中选取了733个实例,利用GPT-4o和LLaMA-3.1模型生成候选子声明,并由人类注释者进行审核和修正,以确保子声明的准确性和完整性。此外,FactLens还引入了自动化评估工具,结合LLM和统计方法,对子声明的质量进行多维度评估,从而确保数据集的高质量和可靠性。
特点
FactLens数据集的主要特点在于其细粒度验证的精细性和全面性。该数据集不仅提供了复杂声明的分解子声明,还通过多维度的评估指标(如原子性、充分性、覆盖率、冗余性等)对子声明的质量进行量化评估。这种细粒度的分解和评估方法,使得验证过程更加精确,能够更准确地识别声明中的细微错误,从而提高验证的透明度和准确性。此外,FactLens还通过自动化评估工具,实现了对子声明质量的快速评估,大大提高了数据处理的效率。
使用方法
FactLens数据集适用于需要细粒度事实验证的研究和应用场景。用户可以通过该数据集训练和评估细粒度验证模型,特别是那些需要对复杂声明进行分解和验证的模型。使用时,用户可以利用数据集中的子声明和相应的评估指标,进行模型的训练和调优。此外,FactLens还提供了自动化评估工具,用户可以利用这些工具对生成的子声明进行快速评估,从而提高验证的效率和准确性。通过结合FactLens数据集和自动化评估工具,用户可以构建更加精确和高效的事实验证系统。
背景与挑战
背景概述
随着大型语言模型(LLMs)在语言生成和理解方面的显著能力,其在生成事实性错误信息方面的倾向性成为了一个关键限制。为了验证LLM生成的内容和其他来源的主张,传统的验证方法通常依赖于整体模型,这些模型为复杂的主张分配单一的事实性标签,可能掩盖了细微的错误。为此,Kushan Mitra、Dan Zhang、Sajjadur Rahman和Estevam Hruschka等研究人员在Megagon Labs的领导下,于2024年提出了FactLens数据集,旨在通过将复杂主张分解为更小的子主张进行细粒度验证,从而实现更精确的不准确性识别、提高透明度和减少证据检索中的模糊性。
当前挑战
FactLens数据集面临的挑战包括:1) 将原始复杂主张分解为较小子主张的过程中,如何保持上下文和确保与原始主张的语义等价性;2) 确保子主张的质量和可验证性,避免因子主张构造不当而引入的上下文丢失、缺乏原子性或信息失真等问题。此外,构建过程中还需解决如何评估子主张生成质量的问题,这需要结合LLM的评估和统计指标来确保子主张的高质量。
常用场景
经典使用场景
FactLens数据集的经典使用场景在于其对复杂声明进行细粒度事实验证的能力。通过将复杂声明分解为更小的子声明,FactLens能够更精确地识别不准确之处,提高验证过程的透明度和减少证据检索的模糊性。这种细粒度验证方法特别适用于需要高度准确性和透明度的应用,如法律文件审查、医疗信息核实和新闻报道验证。
实际应用
在实际应用中,FactLens数据集被广泛用于自动化事实核查系统,特别是在新闻媒体、法律服务和医疗健康领域。例如,新闻机构可以使用FactLens来快速验证新闻报道中的声明,确保信息的准确性;法律服务提供商可以利用其进行法律文件的事实核查,减少错误和遗漏;医疗机构则可以用于核实医疗信息的准确性,保障患者安全。
衍生相关工作
FactLens数据集的引入激发了大量相关研究工作,特别是在细粒度事实验证和声明分解领域。许多研究者基于FactLens开发了新的验证模型和评估指标,进一步提升了事实核查的精确性和效率。此外,FactLens还促进了跨学科研究,如结合知识图谱和自然语言处理技术,以增强事实验证的深度和广度。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作