five

ElectionRumors2022

收藏
arXiv2024-07-23 更新2024-07-25 收录
下载链接:
https://web.archive.org/web/20220307124146/https://developer.twitter.com/en/docs/twitter-api/v1
下载链接
链接失效反馈
官方服务:
资源简介:
ElectionRumors2022数据集由华盛顿大学等机构的研究人员创建,专注于2022年美国中期选举期间在Twitter上传播的选举相关谣言。该数据集包含181万条推文,涉及135个不同的谣言,数据收集自2022年9月5日至12月1日。数据集的创建过程包括使用关键词筛选和API收集,旨在提供一个全面且低噪音的样本,以支持对选举期间在线谣言传播的深入研究。该数据集的应用领域主要集中在社交媒体分析、信息传播研究以及选举过程中的谣言动态研究,旨在揭示和理解选举期间谣言的形成和传播机制。

The ElectionRumors2022 dataset was created by researchers from the University of Washington and other institutions, focusing on election-related rumors spread on Twitter during the 2022 U.S. midterm elections. This dataset contains 1.81 million tweets involving 135 distinct rumors, and was collected from September 5 to December 1, 2022. The dataset was constructed using keyword filtering and API-based data collection, aiming to provide a comprehensive and low-noise sample to support in-depth research on online rumor propagation during election periods. Its main application areas include social media analysis, information propagation research, and studies on rumor dynamics during electoral processes, with the objective of revealing and understanding the formation and propagation mechanisms of rumors during elections.
提供机构:
华盛顿大学
创建时间:
2024-07-23
搜集汇总
数据集介绍
main_image_url
构建方式
ElectionRumors2022 数据集的构建方式采用了多阶段的方法。首先,研究团队使用 Twitter 的 V1.1 流 API 收集了与 2022 年美国中期选举相关的广泛推文数据。接着,研究助理团队在 9 月 19 日至 12 月 1 日的 10 周内,实时观察了在线关于选举的讨论,并记录了与选举有关的网络内容。然后,在 9 月 26 日至 11 月 22 日的 8 周内,研究人员团队对记录的谣言线索进行了细致的研究和调查,以确保谣言的真实性和完整性。最后,研究团队对谣言进行了后验定性编码,以进一步确保谣言的重复性和一致性,并最终完成了数据集的构建。
特点
ElectionRumors2022 数据集具有以下特点:1. 数据集包含了 2022 年美国中期选举期间在 Twitter 上传播的 135 个谣言相关的 1.81 百万条推文,其中 88.0% 为转发推文。2. 数据集包含了与每个谣言相关的元数据,如谣言的标识号、关注州、简短标题以及相关新闻报道或事实核查的链接。3. 数据集包含了与每个推文相关的元数据,如推文 ID、匿名用户 ID 以及对应的谣言 ID。4. 数据集还包含了与每个 URL 相关的元数据,如 URL 的完整地址和域名。
使用方法
使用 ElectionRumors2022 数据集的方法包括:1. 进行定量分析,例如分析推文的发布频率、地理位置分布、用户政治倾向分布以及外部链接的分布等。2. 进行定性分析,例如分析谣言的传播机制、谣言的内容和形式、谣言对选举的影响等。3. 进行混合方法分析,例如结合定量和定性方法,对特定谣言进行深入分析,以揭示谣言的传播规律和影响。4. 使用数据集进行跨时间比较研究,例如将 2022 年的数据与 2020 年的数据进行比较,以了解谣言传播的变化趋势。
背景与挑战
背景概述
在线谣言的传播是一个紧迫的社会挑战,也是跨领域研究的活跃领域。在2022年美国中期选举的背景下,Twitter(现已更名为X)作为分享信息的重要社交媒体平台,包括可能被证明是虚假、误导或未经证实的谣言。为了提高对选举中在线谣言动态的理解,我们提供了一个包含180万条Twitter帖子的大数据集,这些帖子对应于135个在2022年中期选举季节(9月5日至12月1日)在网上传播的谣言。我们描述了如何收集、编制和补充这些数据,并提供了一系列探索性分析,以及与之前发表的关于2020年选举谣言的数据集的比较。我们还对亚利桑那州选举的三个不同谣言进行了混合方法分析,这是2022年选举谣言中特别突出的焦点。最后,我们提供了一系列潜在的未来方向,说明如何使用此数据集来促进对在线谣言、错误信息和虚假信息的研究。
当前挑战
在线谣言的传播是一个紧迫的社会挑战,也是跨领域研究的活跃领域。在2022年美国中期选举的背景下,Twitter(现已更名为X)作为分享信息的重要社交媒体平台,包括可能被证明是虚假、误导或未经证实的谣言。为了提高对选举中在线谣言动态的理解,我们提供了一个包含180万条Twitter帖子的大数据集,这些帖子对应于135个在2022年中期选举季节(9月5日至12月1日)在网上传播的谣言。我们描述了如何收集、编制和补充这些数据,并提供了一系列探索性分析,以及与之前发表的关于2020年选举谣言的数据集的比较。我们还对亚利桑那州选举的三个不同谣言进行了混合方法分析,这是2022年选举谣言中特别突出的焦点。最后,我们提供了一系列潜在的未来方向,说明如何使用此数据集来促进对在线谣言、错误信息和虚假信息的研究。
常用场景
经典使用场景
ElectionRumors2022 数据集主要用于研究 2022 年美国中期选举期间 Twitter 上关于选举谣言的传播动态。该数据集包含了 135 个不同的谣言,以及与之相关的 181 万条推文。研究人员可以通过分析这些推文,了解谣言的传播速度、范围和影响力,以及不同政治立场用户之间的互动模式。此外,该数据集还可以用于比较不同选举周期中谣言传播的异同,以及研究谣言与虚假信息、误导信息之间的关系。
解决学术问题
ElectionRumors2022 数据集解决了多个学术研究问题。首先,它提供了一个关于中期选举谣言的全面数据集,填补了之前研究中主要关注总统选举的空白。其次,该数据集提供了关于谣言传播动态的详细分析,有助于理解谣言在选举中的作用以及其对选举结果可能产生的影响。最后,该数据集为研究谣言与政治立场、地理位置之间的关系提供了丰富的数据支持。
衍生相关工作
ElectionRumors2022 数据集衍生出了多个相关的经典工作。首先,它为研究社交媒体上谣言的传播提供了宝贵的数据资源,为后续研究提供了重要的基础。其次,该数据集激发了关于谣言与政治立场、地理位置之间关系的研究,有助于深入理解谣言的传播机制。最后,该数据集为开发谣言检测和预防工具提供了数据支持,有助于提高社交媒体平台上信息的准确性和可靠性。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作