five

scifact_entailment

收藏
魔搭社区2025-07-04 更新2025-05-31 收录
下载链接:
https://modelscope.cn/datasets/allenai/scifact_entailment
下载链接
链接失效反馈
官方服务:
资源简介:
# Dataset Card for "scifact_entailment" ## Table of Contents - [Dataset Description](#dataset-description) - [Dataset Summary](#dataset-summary) - [Dataset Structure](#dataset-structure) - [Data Fields](#data-fields) - [Data Splits](#data-splits) ## Dataset Description - **Homepage:** [https://scifact.apps.allenai.org/](https://scifact.apps.allenai.org/) - **Repository:** - **Paper:** [Fact or Fiction: Verifying Scientific Claims](https://aclanthology.org/2020.emnlp-main.609/) - **Point of Contact:** [David Wadden](mailto:davidw@allenai.org) ### Dataset Summary SciFact, a dataset of 1.4K expert-written scientific claims paired with evidence-containing abstracts, and annotated with labels and rationales. For more information on the dataset, see [allenai/scifact](https://huggingface.co/datasets/allenai/scifact). This has the same data, but reformatted as an entailment task. A single instance includes a claim paired with a paper title and abstract, together with an entailment label and a list of evidence sentences (if any). ## Dataset Structure ### Data fields - `claim_id`: An `int32` claim identifier. - `claim`: A `string`. - `abstract_id`: An `int32` abstract identifier. - `title`: A `string`. - `abstract`: A list of `strings`, one for each sentence in the abstract. - `verdict`: The fact-checking verdict, a `string`. - `evidence`: A list of sentences from the abstract which provide evidence for the verdict. ### Data Splits | |train|validation| |------|----:|---------:| |claims| 919 | 340|

# "scifact_entailment" 数据集卡片 ## 目录 - [数据集描述](#dataset-description) - [数据集摘要](#dataset-summary) - [数据集结构](#dataset-structure) - [数据字段](#data-fields) - [数据划分](#data-splits) ## 数据集描述 - **主页:** [https://scifact.apps.allenai.org/](https://scifact.apps.allenai.org/) - **仓库:** - **相关论文:** [《Fact or Fiction: Verifying Scientific Claims》](https://aclanthology.org/2020.emnlp-main.609/) - **联系人:** [David Wadden](mailto:davidw@allenai.org) ### 数据集摘要 SciFact是一个包含1400条由专家撰写的科学主张的数据集,每条主张均搭配包含证据的论文摘要,并附带标注标签与论证依据。如需了解该数据集的更多详情,请访问 [allenai/scifact](https://huggingface.co/datasets/allenai/scifact)。本数据集与上述SciFact数据集内容一致,但已被重新格式化为蕴含推理任务(entailment task)。单个数据样本包含一条科学主张、一篇论文的标题与摘要,同时附带蕴含推理标签以及证据句子列表(若存在)。 ## 数据集结构 ### 数据字段 - `claim_id`:`int32`类型的主张标识符。 - `claim`:字符串类型,存储科学主张内容。 - `abstract_id`:`int32`类型的摘要标识符。 - `title`:字符串类型,存储论文标题。 - `abstract`:字符串列表,每个元素对应摘要中的一个句子。 - `verdict`:字符串类型,为事实核查的判定结果。 - `evidence`:字符串列表,包含摘要中可为判定结果提供支撑的证据句子。 ### 数据划分 | |训练集|验证集| |------|----:|---------:| |主张数| 919 | 340|
提供机构:
maas
创建时间:
2025-05-27
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作