five

LIAR

收藏
魔搭社区2025-12-03 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/LIAR
下载链接
链接失效反馈
官方服务:
资源简介:
displayName: LIAR labelTypes: - Classification license: - LIAR Custom mediaTypes: - Text paperUrl: https://arxiv.org/pdf/1705.00648v1.pdf publishDate: "2017" publishUrl: https://github.com/tfs4/liar_dataset publisher: - University of California tags: - Fake News taskTypes: - Text Classification - Fake News Detection --- # 数据集介绍 ## 简介 我们介绍了骗子:一个新的、公开可用的假新闻检测数据集。我们从 PolitiFact.com 收集了长达十年、12800 条人工标记的各种上下文的简短陈述,该网站提供了详细的分析报告和每个案例的源文件链接。该数据集也可用于事实检查研究。值得注意的是,这个新数据集比以前最大的类似类型的公共假新闻数据集大一个数量级。根据经验,我们研究了基于表面语言模式的自动假新闻检测。我们设计了一种新颖的混合卷积神经网络来整合元数据和文本。我们展示了这种混合方法可以改进纯文本深度学习模型。 ## 引文 ``` @article{wang2017liar, title={" liar, liar pants on fire": A new benchmark dataset for fake news detection}, author={Wang, William Yang}, journal={arXiv preprint arXiv:1705.00648}, year={2017} } ``` ## Download dataset :modelscope-code[]{type="git"}

展示名:LIAR 标签类型:分类 许可协议:LIAR 定制许可 媒体类型:文本 论文链接:https://arxiv.org/pdf/1705.00648v1.pdf 发布日期:2017年 发布地址:https://github.com/tfs4/liar_dataset 发布方:加利福尼亚大学 标签:假新闻(Fake News) 任务类型:文本分类、假新闻检测(Fake News Detection) --- # 数据集介绍 ## 简介 我们在此介绍LIAR数据集——一款全新且可公开获取的假新闻检测基准数据集。研究团队从PolitiFact.com平台采集了十年间的12800条经人工标注的多上下文简短陈述,该平台可为每条案例提供详尽的分析报告与源文件链接。本数据集亦可应用于事实核查领域的相关研究。值得关注的是,本数据集的规模较此前同类型公开假新闻数据集的最大体量高出一个数量级。 本研究针对基于表面语言模式的自动假新闻检测任务开展了实证分析,并设计了一种融合元数据与文本信息的新型混合卷积神经网络。实验结果表明,该混合方法的性能优于纯文本深度学习模型。 ## 引文 @article{wang2017liar, title={" liar, liar pants on fire": A new benchmark dataset for fake news detection}, author={Wang, William Yang}, journal={arXiv preprint arXiv:1705.00648}, year={2017} } ## 下载数据集 :modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-06-30
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
LIAR是一个用于假新闻检测的公开数据集,包含从PolitiFact.com收集的12800条人工标记的简短陈述,时间跨度长达十年,规模比以往类似数据集大一个数量级。该数据集适用于事实检查研究和文本分类任务,特别是用于开发基于深度学习的假新闻检测模型,如混合卷积神经网络。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作