five

CorpusPlebiscitoPaz2016

收藏
github2023-10-25 更新2024-05-31 收录
下载链接:
https://github.com/laurabonillaneira/CorpusPlebiscitoPaz2016
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了2016年哥伦比亚和平公投相关的推文,用于博士论文研究。数据集分为Síalapaz和Noalapaz两个主要文件夹,分别代表支持和平公投的是和反对的否。每个文件夹下有三个子文件夹,代表不同的研究对象。每个子文件夹包含两种格式的文件:.csv和.txt,分别标记为P1、P2和P3,代表不同的研究周期。文件中带有RT标记的是转发推文,带有cut标记的是剪辑后的推文。

This dataset comprises tweets related to the 2016 Colombian peace referendum, utilized for doctoral dissertation research. The dataset is organized into two primary folders, Síalapaz and Noalapaz, representing the 'Yes' and 'No' votes in support of the peace referendum, respectively. Each folder contains three subfolders, corresponding to different research subjects. Within each subfolder, files are available in two formats: .csv and .txt, labeled as P1, P2, and P3, which denote distinct research periods. Tweets marked with 'RT' are retweets, while those marked with 'cut' are edited versions of the original tweets.
创建时间:
2023-08-09
原始信息汇总

CorpusPlebiscitoPaz2016 数据集概述

数据集结构

  • 主文件夹:包含两个主要文件夹 SíalapazNoalapaz,分别代表支持和平协议的“是”和反对和平协议的“否”。
  • 子文件夹:每个主文件夹下有三个子文件夹,以研究的个人或团体命名,如 Todosxlapaz
  • 文件格式:每个子文件夹内包含两种格式的文件,.csv.txt
  • 文件标识:文件根据时间段标记为 P1(第一阶段)、P2(第二阶段)和 P3(第三阶段)。
  • 特殊标记:文件名中带有 RT 的表示转发推文,带有 cut 的表示剪辑后的推文。

文件示例

  • 例如文件 TodosPorLaPaz_P1_cut.csv 表示来自账户 todoxlapaz 在第二阶段分析的推文。
搜集汇总
数据集介绍
main_image_url
构建方式
CorpusPlebiscitoPaz2016数据集的构建基于2016年哥伦比亚和平协议公投期间Twitter上的推文数据。该数据集通过收集支持和平协议(Síalapaz)和反对和平协议(Noalapaz)两方的推文,构建了一个包含多个用户账户的推文样本。每个账户的推文被分为三个时间段(P1、P2、P3),并以.csv和.txt两种格式存储。此外,数据集还包含了转发推文(RT)和经过筛选的推文(cut),确保了数据的多样性和代表性。
特点
CorpusPlebiscitoPaz2016数据集的特点在于其专注于哥伦比亚和平协议公投期间的社会媒体动态,捕捉了支持与反对双方在Twitter上的舆论表达。数据集通过分层结构组织,便于用户按时间段和账户进行数据检索。每个推文样本都经过精心筛选和标注,确保了数据的质量和可用性。此外,数据集还包含了转发推文和原始推文的区分,为研究社交媒体中的信息传播模式提供了丰富的数据支持。
使用方法
CorpusPlebiscitoPaz2016数据集的使用方法较为直观。用户可以通过访问数据集中的文件夹结构,按时间段和账户分类获取推文数据。每个文件夹中的.csv和.txt文件包含了详细的推文信息,用户可以根据研究需求选择相应的文件进行分析。数据集的结构设计使得用户能够轻松地进行时间序列分析、情感分析或信息传播模式研究。此外,数据集中的转发推文和筛选推文的区分,为研究社交媒体中的信息扩散机制提供了便利。
背景与挑战
背景概述
CorpusPlebiscitoPaz2016数据集源于2016年哥伦比亚和平协议公投期间,Twitter平台上支持与反对和平协议的群体所发布的推文。该数据集由博士论文《Ethos colectivo digital: estrategias persuasivas de grupos en Twitter por el Sí y el No en el plebiscito sobre el Acuerdo de paz en Colombia》的研究团队创建,旨在分析社交媒体中集体说服策略的演变及其对公众意见的影响。数据集分为‘Síalapaz’和‘Noalapaz’两个主要类别,分别代表支持与反对和平协议的推文,进一步细分为多个子文件夹,涵盖不同时间段的推文样本。这一数据集为研究社交媒体在政治决策中的作用提供了宝贵的资源,尤其在哥伦比亚和平进程的背景下具有重要的学术价值。
当前挑战
CorpusPlebiscitoPaz2016数据集在构建与应用中面临多重挑战。首先,推文数据的动态性与时效性使得数据采集与整理过程复杂化,尤其是在公投期间,推文数量激增且内容多样。其次,数据标注与分类的准确性至关重要,但由于推文语言的非正式性、多义性以及情感倾向的模糊性,标注工作难度较大。此外,数据集的构建还需考虑隐私与伦理问题,确保推文发布者的个人信息得到妥善保护。最后,如何从海量推文中提取有效信息并构建可解释的模型,以揭示群体说服策略的规律,是研究者在数据分析阶段面临的核心挑战。
常用场景
经典使用场景
CorpusPlebiscitoPaz2016数据集主要用于分析社交媒体在政治决策过程中的影响力,特别是在2016年哥伦比亚和平协议公投期间,Twitter上支持与反对两派的言论动态。该数据集通过收集和分析特定时间段内的推文,为研究者提供了丰富的文本数据,用于探讨社交媒体如何塑造公众意见和政治动员。
解决学术问题
该数据集解决了社交媒体分析中的关键问题,即如何量化社交媒体在重大政治事件中的影响力。通过分析支持与反对和平协议的推文,研究者能够深入理解网络舆论的形成机制及其对政治决策的潜在影响。这一研究不仅填补了社交媒体与政治学交叉领域的研究空白,还为未来的政治传播策略提供了数据支持。
衍生相关工作
基于CorpusPlebiscitoPaz2016数据集,研究者们已经开展了多项相关研究,包括社交媒体中的情感分析、网络舆论的动态建模以及政治动员的数字化策略。这些研究不仅深化了我们对社交媒体在政治事件中作用的理解,还为后续的社交媒体分析工具和方法提供了重要的参考和基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作