five

Twitter Conspiracy Dataset 2022

收藏
arXiv2024-02-05 更新2024-06-21 收录
下载链接:
https://zenodo.org/record/8239530
下载链接
链接失效反馈
官方服务:
资源简介:
Twitter Conspiracy Dataset 2022是由国家研究委员会信息学与电信研究所创建的一个全面Twitter数据集,包含15000个账户,主要用于研究2022年与阴谋论相关的社交媒体活动。该数据集通过分析用户的点赞行为和关注关系来识别参与阴谋论讨论的账户,并包括一个随机选择的控制组,以便进行公平比较。数据集涵盖了3700万条推文,通过比较两个用户组在话题、个人资料和行为特征三个维度的差异,揭示了阴谋论用户与普通用户在行为和活动上的显著差异。此外,该数据集还用于开发一个分类器,以识别与阴谋论相关的用户,其F1分数高达0.94,有效地揭示了与阴谋论账户相关的最显著特征。

Twitter Conspiracy Dataset 2022 is a comprehensive Twitter dataset developed by the Institute of Informatics and Telecommunications of the National Research Council. It encompasses 15,000 accounts and is primarily designed for research on conspiracy theory-related social media activities in 2022. The dataset identifies accounts participating in conspiracy theory discussions by analyzing users' liking behaviors and follow relationships, and includes a randomly selected control group to enable fair comparative studies. Spanning 37 million tweets, it reveals significant disparities in behaviors and activities between conspiracy theory-focused users and ordinary users by comparing the two groups across three dimensions: topics, profile characteristics, and behavioral traits. Additionally, this dataset has been employed to construct a classifier for identifying conspiracy theory-related users, which achieves an F1 score of up to 0.94 and effectively uncovers the most salient features associated with such accounts.
提供机构:
国家研究委员会信息学与电信研究所
创建时间:
2023-08-29
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作