fever/feverous
收藏数据集概述
名称: FEVEROUS
描述: FEVEROUS(Fact Extraction and VERification Over Unstructured and Structured information)是一个事实验证数据集,包含87,026个经过验证的声明。每个声明都附有证据,这些证据以维基百科中的句子和/或表格单元格的形式出现,并附有一个标签,指示这些证据是支持、反驳还是不足以得出结论。
语言: 英语 (en)
许可证: Creative Commons Attribution-ShareAlike 3.0 (cc-by-sa-3.0)
数据集大小: 100K<n<1M
多语言性: 单语
任务类别: 文本分类
任务: 文本声明的验证
数据集结构
-
数据实例大小: 下载的数据集文件大小为187.82 MB,生成的数据集大小为123.25 MB,总磁盘使用量为311.07 MB。
-
数据字段:
id(int): 样本ID。label(ClassLabel): 声明的标注标签,可以是"SUPPORTS", "REFUTES", "NOT ENOUGH INFO"之一。claim(str): 声明的文本。evidence(list of dict): 证据集,每个集包含字典,字典中有content和context两个字段。annotator_operations(list of dict): 标注者用于查找证据和得出结论的操作列表。expected_challenge(str): 声明生成器选择的验证声明时将面临的挑战。challenge(str): 验证声明的主要挑战。
-
数据分割:
分割 示例数量 train 71291 validation 7890 test 7845
数据集创建
- 来源数据: 扩展自维基百科。
- 标注者: 众包。
- 语言创建者: 发现。
许可证信息
这些数据标注包含来自维基百科的材料,根据维基百科版权政策获得许可。这些标注根据描述的许可证条款提供,或根据Creative Commons Attribution-ShareAlike License (version 3.0)提供。
引用信息
如果您使用此数据集,请引用以下文献: bibtex @inproceedings{Aly21Feverous, author = {Aly, Rami and Guo, Zhijiang and Schlichtkrull, Michael Sejr and Thorne, James and Vlachos, Andreas and Christodoulopoulos, Christos and Cocarascu, Oana and Mittal, Arpit}, title = {{FEVEROUS}: Fact Extraction and {VERification} Over Unstructured and Structured information}, eprint={2106.05707}, archivePrefix={arXiv}, primaryClass={cs.CL}, year = {2021} }




