scifact_entailment
收藏魔搭社区2025-07-04 更新2025-05-31 收录
下载链接:
https://modelscope.cn/datasets/allenai/scifact_entailment
下载链接
链接失效反馈官方服务:
资源简介:
# Dataset Card for "scifact_entailment"
## Table of Contents
- [Dataset Description](#dataset-description)
- [Dataset Summary](#dataset-summary)
- [Dataset Structure](#dataset-structure)
- [Data Fields](#data-fields)
- [Data Splits](#data-splits)
## Dataset Description
- **Homepage:** [https://scifact.apps.allenai.org/](https://scifact.apps.allenai.org/)
- **Repository:**
- **Paper:** [Fact or Fiction: Verifying Scientific Claims](https://aclanthology.org/2020.emnlp-main.609/)
- **Point of Contact:** [David Wadden](mailto:davidw@allenai.org)
### Dataset Summary
SciFact, a dataset of 1.4K expert-written scientific claims paired with evidence-containing abstracts, and annotated with labels and rationales.
For more information on the dataset, see [allenai/scifact](https://huggingface.co/datasets/allenai/scifact).
This has the same data, but reformatted as an entailment task. A single instance includes a claim paired with a paper title and abstract, together with an entailment label and a list of evidence sentences (if any).
## Dataset Structure
### Data fields
- `claim_id`: An `int32` claim identifier.
- `claim`: A `string`.
- `abstract_id`: An `int32` abstract identifier.
- `title`: A `string`.
- `abstract`: A list of `strings`, one for each sentence in the abstract.
- `verdict`: The fact-checking verdict, a `string`.
- `evidence`: A list of sentences from the abstract which provide evidence for the verdict.
### Data Splits
| |train|validation|
|------|----:|---------:|
|claims| 919 | 340|
# "scifact_entailment" 数据集卡片
## 目录
- [数据集描述](#dataset-description)
- [数据集摘要](#dataset-summary)
- [数据集结构](#dataset-structure)
- [数据字段](#data-fields)
- [数据划分](#data-splits)
## 数据集描述
- **主页:** [https://scifact.apps.allenai.org/](https://scifact.apps.allenai.org/)
- **仓库:**
- **相关论文:** [《Fact or Fiction: Verifying Scientific Claims》](https://aclanthology.org/2020.emnlp-main.609/)
- **联系人:** [David Wadden](mailto:davidw@allenai.org)
### 数据集摘要
SciFact是一个包含1400条由专家撰写的科学主张的数据集,每条主张均搭配包含证据的论文摘要,并附带标注标签与论证依据。如需了解该数据集的更多详情,请访问 [allenai/scifact](https://huggingface.co/datasets/allenai/scifact)。本数据集与上述SciFact数据集内容一致,但已被重新格式化为蕴含推理任务(entailment task)。单个数据样本包含一条科学主张、一篇论文的标题与摘要,同时附带蕴含推理标签以及证据句子列表(若存在)。
## 数据集结构
### 数据字段
- `claim_id`:`int32`类型的主张标识符。
- `claim`:字符串类型,存储科学主张内容。
- `abstract_id`:`int32`类型的摘要标识符。
- `title`:字符串类型,存储论文标题。
- `abstract`:字符串列表,每个元素对应摘要中的一个句子。
- `verdict`:字符串类型,为事实核查的判定结果。
- `evidence`:字符串列表,包含摘要中可为判定结果提供支撑的证据句子。
### 数据划分
| |训练集|验证集|
|------|----:|---------:|
|主张数| 919 | 340|
提供机构:
maas
创建时间:
2025-05-27



