five

Replication data for: \"Testing Propositions Derived from Twitter Studies: Generalization and Replication in Computational Social Science\"

收藏
DataONE2018-07-07 更新2024-06-08 收录
下载链接:
https://search.dataone.org/view/sha256:73b6efe0abacdfa3823cb274f45c3aa22aafe48ca7fbf3662cc9ca6b72636f82
下载链接
链接失效反馈
官方服务:
资源简介:
Replication is an essential requirement for scientific discovery. The current study aims to generalize and replicate 10 propositions made in previous Twitter studies using a representative dataset. Our findings suggest 6 out of 10 propositions could not be replicated due to the variations of data collection, analytic strategies employed and inconsistent measurements. The replication data include 4 files: 1. EgoAlterProfiles (egos are randomly selected Twitter users; alters are the followers and followees of the egos) 2. EgoNetworks (all egos and their following relationships with alters) 3. Exposure (the aggregated data for testing exposure hypothesis) 4. EgoTimelines (all tweets information posted by egos) All datasets have been anonymized.

重复验证是科学发现的必要条件。本研究旨在利用一套具有代表性的数据集,对既往推特(Twitter)相关研究中提出的10项研究命题进行推广与重复验证。研究结果显示,由于数据采集方式、所采用的分析策略存在差异,且测量标准不统一,10项命题中有6项未能通过重复验证。本次重复验证所用数据集包含4个文件: 1. 自我-他人档案(EgoAlterProfiles):其中自我(egos)为随机选取的推特用户,他人(alters)为该类自我用户的关注者与关注对象; 2. 自我网络(EgoNetworks):包含所有自我用户及其与他人的关注关系; 3. 暴露度数据(Exposure):用于检验暴露假说的聚合数据集; 4. 自我时间线数据(EgoTimelines):自我用户发布的全部推文信息。 所有数据集均已完成匿名化处理。
创建时间:
2023-11-21
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作