Verifee
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Verifee
下载链接
链接失效反馈官方服务:
资源简介:
我们介绍了Verifee数据集: 具有细粒度的可信赖性注释的新闻文章的新颖数据集。我们开发了一种详细的方法,根据文本的参数评估文本,包括编辑透明度,记者惯例和客观报道,同时惩罚操纵技术。我们带来了来自社交,媒体和计算机科学的各种研究人员,以克服这一跨学科问题的障碍和有限的框架。我们从近60个捷克在线新闻来源收集了超过10,000篇独特的文章。这些被归类为我们提出的信誉范围内的4个类别之一,从完全值得信赖的文章一直到操纵性文章。我们会提供详细的统计数据,并研究整个集合中出现的趋势。最后,我们在可信性分类任务上使用我们的数据集微调多个流行的序列到序列语言模型,并报告0.52的最佳测试F-1得分。我们在https:// verifee.ai/research上全文开源数据集,注释方法和注释的说明,以实现轻松的构建工作。我们相信类似的方法可以帮助防止虚假信息,并在媒体素养领域进行教育。
提供机构:
OpenDataLab
创建时间:
2023-03-10
搜集汇总
数据集介绍

背景与挑战
背景概述
Verifee是一个包含细粒度可信赖性注释的新闻文章数据集,收录了超过10,000篇来自捷克在线新闻源的文章,并根据编辑透明度、记者惯例和客观报道等参数分为4个信誉类别。该数据集可用于可信性分类任务,在微调序列到序列模型上取得了0.52的F-1得分,由伦敦大学学院和查理大学于2022年发布。
以上内容由遇见数据集搜集并总结生成



