dwadden/covidfact_entailment
收藏Hugging Face2023-10-31 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/dwadden/covidfact_entailment
下载链接
链接失效反馈官方服务:
资源简介:
COVID-FACT是一个关于COVID-19声明的数据集。该版本的数据集遵循MultiVerS建模论文的预处理步骤,将声明与科学研究文章的摘要进行验证。数据集包含蕴含标签和理由。数据集的特征包括声明ID、声明、摘要ID、标题、摘要、裁决和证据。数据集的大小在1K到10K之间,且是单语言的(英语)。数据集的创建者是通过专家生成的,语言是发现的,许可证为cc-by-nc-2.0。数据集的来源是原始的,任务类别是文本分类,任务ID是事实核查。数据集的下载大小为3610222字节,数据集大小为2070727字节。数据集的训练集包含940个例子,测试集包含317个例子。
提供机构:
dwadden
原始信息汇总
数据集概述
数据集摘要
COVID-FACT 是一个关于 COVID-19 声明的数据集。该版本的预处理遵循 MultiVerS 建模论文,验证声明与科学研究文章的摘要。包含蕴含标签和理由。
数据集结构
数据字段
claim_id: 声明的标识符,类型为int32。claim: 声明内容,类型为string。abstract_id: 摘要的标识符,类型为int32。title: 摘要的标题,类型为string。abstract: 摘要中的句子列表,每个句子为string。verdict: 事实核查的裁决,类型为string。evidence: 摘要中提供裁决证据的句子列表。
数据集信息
- 特征:
claim_id:int32claim:stringabstract_id:int32title:stringabstract: 序列stringverdict:stringevidence: 序列int32
- 分割:
train: 1547185 字节, 940 个样本test: 523542 字节, 317 个样本
- 下载大小: 3610222 字节
- 数据集大小: 2070727 字节
数据集详情
- 标注创建者: 专家生成
- 语言创建者: 发现
- 语言: 英语
- 许可证: CC BY-NC 2.0
- 多语言性: 单语
- 大小类别: 1K<n<10K
- 源数据集: 原始
- 任务类别: 文本分类
- 任务ID: 事实核查
- 美观名称: CovidFact



