EleutherAI/fever
收藏数据集概述
基本信息
- 名称: FEVER
- 语言: 英语
- 许可证: CC-BY-SA-3.0, GPL-3.0
- 多语言性: 单语种
- 规模: 100K<n<1M
- 源数据: 扩展自Wikipedia
- 任务类别: 文本分类
- 标签: 知识验证
数据集结构
配置版本
-
v1.0
- 特征:
id: int32label: stringclaim: stringevidence_annotation_id: int32evidence_id: int32evidence_wiki_url: stringevidence_sentence_id: int32
- 分割:
train: 263822 样本, 24147163 字节dev: 28625 样本, 2696375 字节paper_dev: 14475 样本, 1348943 字节paper_test: 14150 样本, 1347432 字节
- 下载大小: 44853972 字节
- 数据集大小: 40043693 字节
- 特征:
-
v2.0
- 特征:
id: int32label: stringclaim: stringevidence_annotation_id: int32evidence_id: int32evidence_wiki_url: stringevidence_sentence_id: int32
- 分割:
validation: 2384 样本, 306243 字节
- 下载大小: 392466 字节
- 数据集大小: 306243 字节
- 特征:
-
wiki_pages
- 特征:
id: stringtext: stringlines: string
- 分割:
wikipedia_pages: 5416537 样本, 7254115038 字节
- 下载大小: 1713485474 字节
- 数据集大小: 7254115038 字节
- 特征:
数据集创建
- 注释创建者: 众包
- 语言创建者: 已发现
许可证信息
-
FEVER许可证:
这些数据注释包含了来自维基百科的材料,根据维基百科版权政策获得许可。这些注释根据维基百科文章页面上描述的许可条款提供,或者在维基百科许可条款不可用的情况下,根据知识共享署名-相同方式共享许可(版本3.0)提供,网址为http://creativecommons.org/licenses/by-sa/3.0/(统称为“许可条款”)。您只能在遵守适用许可条款的情况下使用这些文件。
引用信息
-
FEVER数据集: bibtex @inproceedings{Thorne18Fever, author = {Thorne, James and Vlachos, Andreas and Christodoulopoulos, Christos and Mittal, Arpit}, title = {{FEVER}: a Large-scale Dataset for Fact Extraction and {VERification}}, booktitle = {NAACL-HLT}, year = {2018} }
-
FEVER 2.0 Adversarial Attacks数据集: bibtex @inproceedings{Thorne19FEVER2, author = {Thorne, James and Vlachos, Andreas and Cocarascu, Oana and Christodoulopoulos, Christos and Mittal, Arpit}, title = {The {FEVER2.0} Shared Task}, booktitle = {Proceedings of the Second Workshop on {Fact Extraction and VERification (FEVER)}}, year = {2018} }




