FEVER (Fact Extraction and VERification)

Name: FEVER (Fact Extraction and VERification)
Creator: OpenDataLab
Published: 2026-05-24 05:30:03
License: 暂无描述

OpenDataLab2026-05-24 更新2024-05-09 收录

下载链接：

https://opendatalab.org.cn/OpenDataLab/FEVER

下载链接

链接失效反馈

官方服务：

资源简介：

FEVER 是一个公开可用的数据集，用于对文本源进行事实提取和验证。它由 185,445 个声明组成，根据维基百科页面的介绍部分手动验证并分类为 SUPPORTED、REFUTED 或 NOTENOUGHINFO。对于前两个类别，系统和注释者还需要返回句子组合，形成支持或反驳该主张的必要证据。这些声明是由人类注释者从维基百科中提取声明并以各种方式对其进行变异产生的，其中一些是改变含义的。每个声明的验证是由注释者在单独的注释过程中进行的，他们知道页面而不是提取原始声明的句子，因此在 31.75% 的声明中，超过一个句子被认为是适当的证据。索赔要求在 16.82% 的案件中组合来自多个句子的证据。此外，在 12.15% 的索赔中，该证据取自多页。

FEVER is a publicly available dataset for fact extraction and verification over textual sources. It consists of 185,445 claims, which are manually verified and categorized into SUPPORTED, REFUTED, or NOTENOUGHINFO based on the introduction sections of Wikipedia pages. For the first two categories, systems and annotators are also required to return sentence combinations that form the necessary evidence to support or refute the claim. These claims are generated by human annotators extracting statements from Wikipedia and mutating them in various ways, some of which alter the meaning. The verification of each claim is conducted by annotators in a separate annotation process, who are provided with the relevant pages rather than the exact sentences from which the original claim was extracted. As a result, in 31.75% of claims, more than one sentence is considered appropriate evidence. Claims require combining evidence from multiple sentences in 16.82% of cases. Additionally, in 12.15% of claims, the evidence is taken from multiple pages.

提供机构：

OpenDataLab

创建时间：

2022-05-23

搜集汇总

数据集介绍

构建方式

FEVER数据集的构建基于大规模的文本语料库，通过自动化的方法从维基百科中提取事实陈述，并人工标注这些陈述的真实性。构建过程中，首先从维基百科中随机抽取句子，然后由专家团队对这些句子进行验证，确定其是否为真实事实。此外，数据集还包括了反事实陈述，以增强模型的鲁棒性。

使用方法

FEVER数据集主要用于训练和评估事实验证模型。研究者可以通过该数据集训练模型，使其能够自动判断给定陈述的真实性。使用时，可以将数据集分为训练集、验证集和测试集，分别用于模型的训练、调参和最终评估。此外，数据集还可以用于研究信息检索、自然语言处理等领域的相关问题。

背景与挑战

背景概述

在信息爆炸的时代，如何从海量文本中准确提取事实并进行验证成为了一个亟待解决的问题。FEVER（Fact Extraction and VERification）数据集应运而生，由伦敦大学学院（UCL）和爱丁堡大学的研究团队于2018年共同开发。该数据集旨在为机器提供一个标准化的测试平台，以评估其在事实提取和验证任务中的表现。通过提供大量标注的文本数据，FEVER数据集为研究者提供了一个宝贵的资源，推动了自然语言处理领域在事实验证技术上的进步。

当前挑战

FEVER数据集的构建过程中面临诸多挑战。首先，事实提取需要从复杂的文本结构中识别出关键信息，这对模型的语义理解能力提出了高要求。其次，事实验证不仅要求模型能够准确提取信息，还需判断其真实性，这涉及到对多源信息的整合与比对。此外，数据集的标注过程需要高度专业化的知识，以确保标注的准确性和一致性。这些挑战共同构成了FEVER数据集在推动事实验证技术发展中的重要课题。

发展历史

创建时间与更新

FEVER数据集由伦敦大学学院和爱丁堡大学的研究团队于2018年创建，旨在推动事实验证领域的研究。该数据集自创建以来，经历了多次更新，以适应不断发展的技术需求和研究方向。

重要里程碑

FEVER数据集的首次发布标志着事实验证领域的一个重要里程碑，它为研究人员提供了一个标准化的基准，用于评估和比较不同的事实验证模型。随后，2019年发布的FEVER 2.0版本引入了更多的数据和更复杂的任务，进一步推动了该领域的发展。此外，FEVER数据集还成功应用于多个国际竞赛，如SemEval 2020，极大地促进了事实验证技术的实际应用和创新。

当前发展情况

当前，FEVER数据集已成为事实验证领域的重要资源，广泛应用于学术研究和工业实践。它不仅帮助研究人员开发和评估新的算法，还促进了跨学科的合作，如自然语言处理和信息检索。FEVER数据集的持续更新和扩展，确保了其在面对新兴挑战时的适应性和有效性，为推动事实验证技术的进步做出了重要贡献。

发展历程

FEVER数据集首次发布，旨在为事实验证任务提供一个标准化的基准。
2018年
FEVER共享任务启动，吸引了全球多个研究团队参与，推动了事实验证技术的发展。
2019年
FEVER数据集扩展，增加了更多的标注数据和新的验证任务，进一步丰富了数据集的内容和应用场景。
2020年

常用场景

经典使用场景

在自然语言处理领域，FEVER数据集的经典使用场景主要集中在事实验证任务上。该数据集通过提供大量的文本片段和对应的事实陈述，使得研究人员能够开发和评估自动化的信息提取和验证系统。这些系统通常需要从大规模文本中提取相关信息，并判断其与给定陈述的一致性，从而验证陈述的真实性。

解决学术问题

FEVER数据集解决了自然语言处理中长期存在的事实验证问题。通过提供结构化的数据和明确的验证任务，该数据集促进了相关算法的发展，如信息检索、文本匹配和逻辑推理。这些算法不仅提高了事实验证的准确性，还为其他相关任务如问答系统和知识图谱构建提供了技术支持，推动了整个领域的进步。

实际应用

在实际应用中，FEVER数据集支持的系统可以广泛应用于新闻验证、社交媒体内容审核和在线教育等领域。例如，新闻机构可以利用这些系统自动验证新闻报道的真实性，减少虚假信息的传播；社交媒体平台则可以通过这些系统识别和过滤虚假信息，提升用户体验和平台的可信度。

数据集最近研究