five

dwadden/covidfact_entailment

收藏
Hugging Face2023-10-31 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/dwadden/covidfact_entailment
下载链接
链接失效反馈
官方服务:
资源简介:
COVID-FACT是一个关于COVID-19声明的数据集。该版本的数据集遵循MultiVerS建模论文的预处理步骤,将声明与科学研究文章的摘要进行验证。数据集包含蕴含标签和理由。数据集的特征包括声明ID、声明、摘要ID、标题、摘要、裁决和证据。数据集的大小在1K到10K之间,且是单语言的(英语)。数据集的创建者是通过专家生成的,语言是发现的,许可证为cc-by-nc-2.0。数据集的来源是原始的,任务类别是文本分类,任务ID是事实核查。数据集的下载大小为3610222字节,数据集大小为2070727字节。数据集的训练集包含940个例子,测试集包含317个例子。
提供机构:
dwadden
原始信息汇总

数据集概述

数据集摘要

COVID-FACT 是一个关于 COVID-19 声明的数据集。该版本的预处理遵循 MultiVerS 建模论文,验证声明与科学研究文章的摘要。包含蕴含标签和理由。

数据集结构

数据字段

  • claim_id: 声明的标识符,类型为 int32
  • claim: 声明内容,类型为 string
  • abstract_id: 摘要的标识符,类型为 int32
  • title: 摘要的标题,类型为 string
  • abstract: 摘要中的句子列表,每个句子为 string
  • verdict: 事实核查的裁决,类型为 string
  • evidence: 摘要中提供裁决证据的句子列表。

数据集信息

  • 特征:
    • claim_id: int32
    • claim: string
    • abstract_id: int32
    • title: string
    • abstract: 序列 string
    • verdict: string
    • evidence: 序列 int32
  • 分割:
    • train: 1547185 字节, 940 个样本
    • test: 523542 字节, 317 个样本
  • 下载大小: 3610222 字节
  • 数据集大小: 2070727 字节

数据集详情

  • 标注创建者: 专家生成
  • 语言创建者: 发现
  • 语言: 英语
  • 许可证: CC BY-NC 2.0
  • 多语言性: 单语
  • 大小类别: 1K<n<10K
  • 源数据集: 原始
  • 任务类别: 文本分类
  • 任务ID: 事实核查
  • 美观名称: CovidFact
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作