PolitiFact
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/nguyenvo09/emnlp2020
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了3,568条新闻声明,这些声明被标记为从真实到极度虚假的六种可信度级别。此外,这些声明被细分为真实、混合和虚假三种可信度标签。数据集的规模为3,568条声明和29,556篇文章。该数据集的任务是对声明进行验证。
This dataset contains 3,568 news claims annotated with six credibility levels ranging from true to extremely false. Additionally, these claims are categorized into three credibility tags: true, mixed, and false. The dataset consists of 3,568 claims and 29,556 articles, and its core task is claim verification.
提供机构:
Popat et al.
搜集汇总
数据集介绍

背景与挑战
背景概述
PolitiFact数据集是EMNLP 2020论文中用于事实核查和假新闻检测研究的数据集,包含两个测试场景(SC1和SC2)和增强数据(MAN-A),支持多模态分析(如文本和图像特征)。数据集结构包括训练、开发、测试文件以及图像特征文件,旨在通过信息检索方法帮助缓解假新闻传播。
以上内容由遇见数据集搜集并总结生成



