WarMM-2022

github2023-05-29 更新2024-05-31 收录

下载链接：

https://github.com/kunilovskaya/WarMM-2022

下载链接

链接失效反馈

官方服务：

资源简介：

Wartime Media Monitor (WarMM-2022)：俄罗斯社交媒体上信息操纵的研究，特别是在俄罗斯-乌克兰战争期间。

Wartime Media Monitor (WarMM-2022): A study on information manipulation on Russian social media, particularly during the Russia-Ukraine War.

创建时间：

2023-03-28

原始信息汇总

WarMM-2022 语料库

数据集描述

WarMM-2022 语料库用于以下研究：

论文标题：Wartime Media Monitor (WarMM-2022): A Study of Information Manipulation on Russian Social Media during the Russia-Ukraine War
作者：Alyukov M., Kunilovskaya M., Semenov A.
发表会议：Proceedings of the 7th Joint SIGHUM Workshop on Computational Linguistics for Cultural Heritage, Social Sciences, Humanities and Literature
出版机构：Association for Computational Linguistics
页码：152-161
年份：2023

数据集内容

该仓库包含以下内容：

完整数据集：WarMM-2022_JulSept_all-media.csv.gz
语料样本：包含来自每种媒体类型（电视、官方新闻和社交媒体）的25个项目
媒体来源列表：用于数据收集的完整媒体机构列表
关键词列表：用于数据分析的完整（分组）关键词列表
论文副本：在LaTeCH-CLfL 2023会议上接受并展示的论文
图表文件夹：论文中使用的图表

引用信息

@inproceedings{Alyukov2023warmm, author = {Alyukov, Maxim and Kunilovskaya, Maria and Semenov, Andrei}, title = {{Wartime Media Monitor (WarMM-2022): A Study of Information Manipulation on Russian Social Media during the Russia-Ukraine War}}, booktitle = {Proceedings of the 7th Joint SIGHUM Workshop on Computational Linguistics for Cultural Heritage, Social Sciences, Humanities and Literature}, pages = {152--161}, publisher = {Association for Computational Linguistics}, year = {2023} }

联系方式

如需进一步信息，请联系 mkunilovskaya@gmail.com。

搜集汇总

数据集介绍

构建方式

WarMM-2022数据集的构建基于对俄罗斯社交媒体在俄乌战争期间信息操纵现象的深入研究。研究团队通过收集来自电视、官方媒体和社交网络的多源数据，结合关键词筛选和媒体渠道分类，构建了一个全面的语料库。数据收集过程涵盖了2022年7月至9月的时间段，确保了数据的时效性和代表性。

特点

WarMM-2022数据集的特点在于其多源性和结构化设计。数据集不仅包含了来自电视、官方媒体和社交网络的多样化数据，还提供了关键词列表和媒体渠道的完整分类。这种设计使得研究者能够从多个维度分析信息操纵的模式和策略。此外，数据集还附带了一组用于论文分析的图表，进一步增强了其研究价值。

使用方法

WarMM-2022数据集的使用方法灵活多样。研究者可以通过解压提供的CSV文件访问完整数据集，或利用样本数据进行初步分析。数据集中的关键词列表和媒体渠道分类为信息操纵研究提供了重要参考。此外，数据集附带的论文和图表为深入理解数据背景和分析方法提供了支持。如需进一步信息，可通过提供的联系方式与数据集作者联系。

背景与挑战

背景概述

WarMM-2022数据集由Maxim Alyukov、Maria Kunilovskaya和Andrei Semenov等研究人员于2023年创建，旨在研究俄罗斯社交媒体在俄乌战争期间的信息操纵现象。该数据集收录了来自电视、官方媒体和社交网络的多源数据，涵盖了2022年7月至9月期间的相关内容。通过分析这些数据，研究人员能够深入探讨信息操纵的策略、传播模式及其对社会的影响。该数据集在计算语言学、文化研究和社会科学领域具有重要价值，为理解战时信息战提供了宝贵资源。

当前挑战

WarMM-2022数据集的研究挑战主要集中在两个方面。首先，信息操纵的识别与分析本身具有高度复杂性，尤其是在多源异构数据中，如何准确区分真实信息与操纵性内容是一个关键问题。其次，数据集的构建过程中面临诸多技术挑战，例如从不同媒体平台（如电视、官方媒体和社交网络）中提取、清洗和整合数据，同时确保数据的代表性和时效性。此外，由于涉及敏感的政治和军事内容，数据收集与处理过程中还需考虑伦理和法律问题，进一步增加了研究的难度。

常用场景

经典使用场景

WarMM-2022数据集在研究俄罗斯社交媒体在俄乌战争期间的信息操纵行为中发挥了关键作用。该数据集通过收集和分析来自电视、官方媒体和社交网络的多源数据，为研究者提供了一个全面的视角，以揭示信息操纵的模式和策略。这一数据集的使用场景主要集中在计算语言学、社会科学和人文科学领域，尤其是在文化传承和信息传播的研究中。

实际应用

在实际应用中，WarMM-2022数据集被广泛用于监测和分析战争期间的信息操纵行为。政府机构、非政府组织和媒体公司利用这一数据集来识别虚假信息、追踪信息传播路径，并评估信息操纵对公众舆论的影响。此外，该数据集还被用于开发自动化工具，以实时监测和应对社交媒体上的信息操纵活动。

衍生相关工作

WarMM-2022数据集衍生了一系列相关研究，特别是在计算语言学和社会科学领域。基于该数据集的研究成果包括信息操纵检测算法、社交媒体分析工具以及战争期间信息传播模型。这些研究不仅推动了学术界对信息操纵的理解，还为实际应用提供了技术支持和理论依据。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集