CrowdChecked
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/CrowdChecked
下载链接
链接失效反馈官方服务:
资源简介:
由于Snopes在互联网用户和研究人员中都很受欢迎,因此我们将Snopes用作我们的目标事实检查网站。我们进一步使用Twitter作为收集用户消息的资源,其中可能包含这些声明的声明和事实检查。
我们的数据收集设置类似于 (Vo和Lee,2019) 中的设置。首先,我们形成一个查询来选择包含指向Snopes的事实检查链接的推文,该链接是回复或引用推文,而不是转发。来自查询的示例结果如图1所示,其中来自人群事实检查器的推文包含指向事实检查文章的链接。然后,我们评估它与第一个推文 (对话的根) 和最后一个回复中所提出的声明 (如果有) 的相关性,以便获得推文验证的文章对。
从2017年10月到2021年10月,我们收集了所有与我们的查询相匹配的推文,总共获得了482,736个独特的点击。我们进一步收集了148,503回复推文和204,250对话 (根) 推文。最后,我们过滤掉格式错误的对,即链接到自己的推文,空推文,非英语的推文,例如在Twitter对象 (“实体”) 中没有解析的url,带有指向事实检查网站的断开链接,以及checkthat'21数据集中的所有推文。我们最终得到了332,660独特的推文-文章对,316,564独特的推文,以及他们指向的Snopes的10,340事实检查文章。
提供机构:
OpenDataLab
创建时间:
2022-11-24



