LIAR
收藏魔搭社区2025-12-03 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/LIAR
下载链接
链接失效反馈官方服务:
资源简介:
displayName: LIAR
labelTypes:
- Classification
license:
- LIAR Custom
mediaTypes:
- Text
paperUrl: https://arxiv.org/pdf/1705.00648v1.pdf
publishDate: "2017"
publishUrl: https://github.com/tfs4/liar_dataset
publisher:
- University of California
tags:
- Fake News
taskTypes:
- Text Classification
- Fake News Detection
---
# 数据集介绍
## 简介
我们介绍了骗子:一个新的、公开可用的假新闻检测数据集。我们从 PolitiFact.com 收集了长达十年、12800 条人工标记的各种上下文的简短陈述,该网站提供了详细的分析报告和每个案例的源文件链接。该数据集也可用于事实检查研究。值得注意的是,这个新数据集比以前最大的类似类型的公共假新闻数据集大一个数量级。根据经验,我们研究了基于表面语言模式的自动假新闻检测。我们设计了一种新颖的混合卷积神经网络来整合元数据和文本。我们展示了这种混合方法可以改进纯文本深度学习模型。
## 引文
```
@article{wang2017liar,
title={" liar, liar pants on fire": A new benchmark dataset for fake news detection},
author={Wang, William Yang},
journal={arXiv preprint arXiv:1705.00648},
year={2017}
}
```
## Download dataset
:modelscope-code[]{type="git"}
展示名:LIAR
标签类型:分类
许可协议:LIAR 定制许可
媒体类型:文本
论文链接:https://arxiv.org/pdf/1705.00648v1.pdf
发布日期:2017年
发布地址:https://github.com/tfs4/liar_dataset
发布方:加利福尼亚大学
标签:假新闻(Fake News)
任务类型:文本分类、假新闻检测(Fake News Detection)
---
# 数据集介绍
## 简介
我们在此介绍LIAR数据集——一款全新且可公开获取的假新闻检测基准数据集。研究团队从PolitiFact.com平台采集了十年间的12800条经人工标注的多上下文简短陈述,该平台可为每条案例提供详尽的分析报告与源文件链接。本数据集亦可应用于事实核查领域的相关研究。值得关注的是,本数据集的规模较此前同类型公开假新闻数据集的最大体量高出一个数量级。
本研究针对基于表面语言模式的自动假新闻检测任务开展了实证分析,并设计了一种融合元数据与文本信息的新型混合卷积神经网络。实验结果表明,该混合方法的性能优于纯文本深度学习模型。
## 引文
@article{wang2017liar,
title={" liar, liar pants on fire": A new benchmark dataset for fake news detection},
author={Wang, William Yang},
journal={arXiv preprint arXiv:1705.00648},
year={2017}
}
## 下载数据集
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-06-30
搜集汇总
数据集介绍

背景与挑战
背景概述
LIAR是一个用于假新闻检测的公开数据集,包含从PolitiFact.com收集的12800条人工标记的简短陈述,时间跨度长达十年,规模比以往类似数据集大一个数量级。该数据集适用于事实检查研究和文本分类任务,特别是用于开发基于深度学习的假新闻检测模型,如混合卷积神经网络。
以上内容由遇见数据集搜集并总结生成



