five

Who_you_should_not_follow_Datasets

收藏
github2017-07-10 更新2024-05-31 收录
下载链接:
https://github.com/lore10/Who_you_should_not_follow_Datasets
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了一系列在厄瓜多尔政府抗议活动中使用的hashtags,分为支持的和反对的两类,以及用于训练模型的推文ID和用户分类结果。数据集还包括了生成这些文件的详细步骤和参考的科学出版物。

This dataset comprises a series of hashtags utilized during government protest activities in Ecuador, categorized into supportive and opposing groups, along with tweet IDs and user classification results for model training. The dataset also includes detailed procedures for generating these files and references to scientific publications.
创建时间:
2017-01-30
原始信息汇总

数据集概述

数据集名称

Who_you_should_not_follow_Datasets

数据集内容

  1. 支持性标签(Supporting_hashtags.json)

    • 包含以下标签:#30s, #revocatoriarodas, #quitovigila, #defensoresrc, #azuaysinnebot, #enlace430, #laoposicionviolentayciega, #mintiendocomopaez, ...
  2. 反对性标签(Opposing_hashtags.json)

    • 包含以下标签:#ecuadorsecanso, #ecuadorprotesta, #marchaguayaquil, #robolucion, #yucaparacorrea, #avanzamospatria, #todosmarchamos, ...
  3. 训练语料库(Training_corpus.txt)

    • 包含多个推文文本,用于训练模型。
  4. 推文ID(Tweets_ids.json)

    • 包含126667个观察值,记录推文ID及其创建日期。
  5. 用户分类结果(Users_classification_results.json)

    • 包含应用学术文章中提出的方法后的用户分类结果。

数据集来源

  • 数据来源于2015年和2016年针对厄瓜多尔政府的罢工期间产生的信息。

引用文献

  • L. Recalde, J. Mendieta, L. Boratto, L. Terán, C. Vaca, and G. Baquerizo. "Who You Should Not Follow: Extracting Word Embeddings from Tweets to Identify Groups of Interest and Hijackers in Demonstrations." (2017)
搜集汇总
数据集介绍
main_image_url
构建方式
Who_you_should_not_follow_Datasets 数据集的构建,是通过采集与分析针对厄瓜多尔政府罢工期间(2015和2016年)的Twitter信息而形成。该数据集涵盖了支持性标签、反对性标签、用于训练模型的推文ID,以及基于特定学术文章提出方法后的用户分类结果。数据以json和txt格式存储,来源于Twitter的查询结果。
特点
该数据集的特点在于,它专门针对社交媒体平台中政治参与背景下的话题劫持现象进行研究。数据集包含了明确定义的支持和反对两类标签,以及相应的推文和用户分类信息,为分析和识别不同政治立场用户提供了直接的文本和分类数据。此外,该数据集的构建与学术研究紧密相连,为相关领域的学术研究提供了可靠的数据基础。
使用方法
使用该数据集时,用户可以依据所提供的json和txt文件,对推文内容和用户分类进行深入分析。数据集包含了必要的复现实验步骤,方便研究者基于此数据集开展进一步的用户分类研究。引用此数据集的学术成果时,建议参考相关学术论文以明确数据集的生成背景和详细使用方法。
背景与挑战
背景概述
Who_you_should_not_follow_Datasets数据集是在社交媒体平台上针对政治参与的研究背景下构建的。该数据集由L. Recalde等研究人员于2017年创建,旨在解决社交媒体中存在的劫持话题标签问题。该数据集收集了与厄瓜多尔政府罢工(2015年和2016年)相关的推文信息,包含支持性话题标签、反对性话题标签、用于训练模型的推文ID以及用户分类结果等数据,对社交媒体话题标签劫持的识别和研究具有重要的参考价值。
当前挑战
该数据集在构建过程中面临的挑战主要包括:如何准确识别和分类劫持的话题标签,以及如何有效地从大量推文数据中提取有用的特征信息。此外,由于社交媒体数据的动态性和复杂性,保持数据集的时效性和准确性也是一个持续的挑战。在研究领域问题上,该数据集解决了如何通过社交媒体推文数据来识别不同政治立场用户群体的问题,这对于理解社交媒体在政治参与中的作用具有显著意义。
常用场景
经典使用场景
在社会科学与计算社会科学领域,Who_you_should_not_follow_Datasets数据集被广泛应用于识别社交媒体中政治参与过程中的话题劫持现象。该数据集通过提供支持性话题标签、反对性话题标签、用于训练模型的推文ID以及用户分类结果,使得研究者能够深入分析社交媒体用户的行为模式。
实际应用
在实践应用方面,Who_you_should_not_follow_Datasets数据集为政府机构、社交媒体平台运营商以及公共信息管理者提供了识别和应对网络舆论操纵的策略。通过运用该数据集,相关部门能够及时监测并处理社交媒体上的不实信息和误导性话题,维护网络环境的健康发展。
衍生相关工作
基于该数据集,已衍生出多项相关研究工作,包括但不限于社交媒体话题分析、用户行为预测、网络舆论监测等领域。这些研究进一步扩展了数据集的应用范围,推动了社交媒体分析技术的发展,并在信息传播、社会网络分析等方面产生了重要影响。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作