包含2020-2021年期间超过40万推文的 politicians 数据集
收藏arXiv2025-02-21 更新2025-02-25 收录
下载链接:
http://arxiv.org/abs/2502.15321v1
下载链接
链接失效反馈官方服务:
资源简介:
politicians 数据集是由德国伊尔梅瑙工业大学、意大利帕多瓦大学、意大利威尼斯大学等机构的研究人员构建的,包含了2020-2021年期间德国、意大利、英国和美国四国政治家在Twitter上的推文。该数据集覆盖了不同层级的政府官员,包括国家行政官员、国家立法官员和地区行政官员,旨在研究政治家在危机期间的信息传播行为,特别是关于误导性信息的分享行为。数据集规模宏大,涉及多个 misinformation resilience 集群的国家,为研究政治传播、误导性信息、社交媒体、危机和政治之间的关系提供了丰富的资源。
The Politicians dataset was constructed by researchers from institutions such as Technische Universität Ilmenau (Germany), University of Padua (Italy), and Ca' Foscari University of Venice (Italy), among others. It encompasses tweets posted on Twitter by politicians across four countries—Germany, Italy, the United Kingdom, and the United States—during 2020 to 2021. The dataset covers government officials at multiple tiers, including national administrative officials, national legislative officials, and regional administrative officials. Its core objective is to investigate the information dissemination behaviors of politicians during crises, with a specific focus on their sharing of misinformation. With a large scale, the dataset covers countries with multiple misinformation resilience clusters, providing a valuable resource for studying the interrelationships among political communication, misinformation, social media, crises, and politics.
提供机构:
德国伊尔梅瑙工业大学经济科学与媒体系, 意大利帕多瓦大学经济学与管理系, 意大利威尼斯大学环境科学与信息统计系, 意大利新学院环境人文中心
创建时间:
2025-02-21
搜集汇总
数据集介绍

构建方式
该数据集通过在Twitter平台上收集2020-2021年期间3,277名政治人物的推文构建而成,涵盖了德国、意大利、英国和美国四个国家,包括国家行政、国家立法和地区行政等多个治理层面。数据集包含了超过40万条推文,这些推文根据其引用的新闻来源的信任评分被分类为可靠信息或误导信息。此外,数据集还区分了与危机相关的误导信息和一般误导信息,并对不同政治党派在信息传播中的作用进行了分析。
特点
该数据集的特点在于其跨国家、多层级和事件驱动的视角,提供了对政治人物在危机期间如何影响误导信息传播的深入理解。数据集揭示了不同国家之间在误导信息分享行为和公众参与度方面的显著差异,以及危机相关误导信息在这些国家中的独特作用。此外,数据集还突出了极右翼和保守党派在误导信息传播中的主导地位,以及公众对危机相关内容的特别关注。
使用方法
用户可以通过分析数据集中不同国家、政治层级和政治党派的信息分享行为和公众参与度,来研究误导信息在社交媒体上的传播模式和影响。用户可以利用数据集中的信任评分来区分可靠信息和误导信息,并通过比较不同类型信息的公众参与度来评估误导信息的吸引力。此外,用户还可以研究危机相关误导信息在不同国家中的传播特点,以及政治党派在信息传播中的作用。
背景与挑战
背景概述
在当今信息时代,社交媒体已成为新闻和信息传播的主要渠道,政治人物作为社会舆论的重要影响者,其信息传播行为对社会公众具有深远影响。本文所涉及的数据集,收集了2020-2021年间来自德国、意大利、英国和美国四国的3,277名政治人物在X平台(原Twitter)上发布的超过40万条推文。该数据集涵盖了国家行政、国家立法和区域行政等多个治理层面的政治人物,旨在研究政治人物在危机时期的信息传播行为及其对公众的影响。该研究由德国伊尔梅瑙工业大学经济科学和媒体系、意大利帕多瓦大学经济学和管理学系、意大利威尼斯卡·福斯卡里大学环境科学、信息学和统计学系,以及意大利新研究所环境人文中心的研究人员共同完成。研究结果显示,意大利和美国政治人物在信息传播中存在较高的错误信息比例,而公众对这些错误信息的参与度也相对较高。此外,研究还发现,危机相关的错误信息在意大利的传播更为广泛,这表明政治立场、治理层级和危机背景在塑造错误信息传播动态中起着关键作用。
当前挑战
该数据集的研究挑战主要体现在以下几个方面:首先,如何准确地区分错误信息和可靠信息是一个难题,因为政治人物发布的信息可能包含原创内容,而现有的基于来源的分类方法无法完全覆盖这些情况。其次,由于研究仅限于X平台,可能无法全面反映政治信息传播的完整图景,未来研究需要纳入更多社交媒体平台以拓宽研究范围。最后,研究仅涵盖了高收入国家,其结果可能无法完全适用于全球范围,未来研究需要扩展到中低收入国家以增强结果的普适性。
常用场景
经典使用场景
该数据集包含了2020-2021年期间超过40万条推文,涵盖了德国、意大利、英国和美国的政治人物。它被广泛用于研究政治人物在社交媒体上的信息传播行为,特别是关于虚假信息的传播。通过分析不同国家、不同层级政治人物的信息传播行为和公众参与度,研究者可以深入了解政治环境如何影响信息的传播,以及政治人物在塑造公众舆论方面的作用。
衍生相关工作
基于该数据集的研究成果,衍生出了许多关于政治信息传播和虚假信息传播的后续研究。这些研究进一步探讨了政治人物如何利用社交媒体塑造公众舆论,以及虚假信息对政治和社会的影响。此外,这些研究还提供了关于不同国家和政治体系在应对虚假信息方面的差异的重要信息,以及危机时期虚假信息的传播特征。
数据集最近研究
最新研究方向
该数据集的研究方向主要集中在政治家在社交媒体上分享错误信息的行为及其与公众互动的关系。研究特别关注了在2020-2021年期间,来自德国、意大利、英国和美国的不同层级的政治家(国家级行政、国家级立法和区域级行政)在Twitter上发布的推文。研究发现,意大利和美国政治家在分享错误信息方面表现最为突出,尤其是在极右翼和保守派立法者中。公众对错误信息的参与度也存在显著差异,例如在美国,错误信息吸引了超过可靠信息的2.5倍的参与度。此外,研究还发现,在危机相关的错误信息方面,意大利政治家分享了比一般错误信息更多的内容,并且在公众参与度上也表现突出。这些发现强调了政治关联、治理层级和危机环境在塑造错误信息动态中的关键作用。研究通过提供跨国和多层次的视角,进一步扩展了相关文献,并揭示了政治行为者在危机期间如何影响错误信息的传播。
相关研究论文
- 1Crisis, Country, and Party Lines: Politicians' Misinformation Behavior and Public Engagement德国伊尔梅瑙工业大学经济科学与媒体系, 意大利帕多瓦大学经济学与管理系, 意大利威尼斯大学环境科学与信息统计系, 意大利新学院环境人文中心 · 2025年
以上内容由遇见数据集搜集并总结生成



