CrowdChecked
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/CrowdChecked
下载链接
链接失效反馈官方服务:
资源简介:
由于Snopes在互联网用户和研究人员中都很受欢迎,因此我们将Snopes用作我们的目标事实检查网站。我们进一步使用Twitter作为收集用户消息的资源,其中可能包含这些声明的声明和事实检查。
我们的数据收集设置类似于 (Vo和Lee,2019) 中的设置。首先,我们形成一个查询来选择包含指向Snopes的事实检查链接的推文,该链接是回复或引用推文,而不是转发。来自查询的示例结果如图1所示,其中来自人群事实检查器的推文包含指向事实检查文章的链接。然后,我们评估它与第一个推文 (对话的根) 和最后一个回复中所提出的声明 (如果有) 的相关性,以便获得推文验证的文章对。
从2017年10月到2021年10月,我们收集了所有与我们的查询相匹配的推文,总共获得了482,736个独特的点击。我们进一步收集了148,503回复推文和204,250对话 (根) 推文。最后,我们过滤掉格式错误的对,即链接到自己的推文,空推文,非英语的推文,例如在Twitter对象 (“实体”) 中没有解析的url,带有指向事实检查网站的断开链接,以及checkthat'21数据集中的所有推文。我们最终得到了332,660独特的推文-文章对,316,564独特的推文,以及他们指向的Snopes的10,340事实检查文章。
提供机构:
OpenDataLab
创建时间:
2022-11-24
搜集汇总
数据集介绍

背景与挑战
背景概述
CrowdChecked数据集基于Snopes事实检查网站和Twitter平台,收集了2017年10月至2021年10月期间的推文数据,通过查询和过滤处理,最终形成332,660个推文-文章对,涉及316,564条独特推文和10,340篇Snopes文章。该数据集由多个研究机构于2022年发布,旨在支持事实检查相关研究。
以上内容由遇见数据集搜集并总结生成



