five

TWikiL

收藏
arXiv2022-05-05 更新2024-06-21 收录
下载链接:
https://doi.org/10.5281/zenodo.5845374
下载链接
链接失效反馈
官方服务:
资源简介:
TWikiL数据集由奥尔堡大学哥本哈根通信与心理学系创建,包含了2006年至2021年间所有在Twitter上发布的Wikipedia链接。该数据集不仅记录了链接,还通过Wikidata标识符和Wikipedia主题类别丰富了引用文章的信息。TWikiL数据集分为原始版和精选版,原始版包含所有Wikipedia链接的Tweet ID,而精选版则进一步筛选,只包含指向Wikipedia文章页面的链接。此数据集对于研究Wikipedia与Twitter之间的相互关系、信息传播模式以及社会媒体中的信息生态具有重要价值,尤其适用于分析历史数据和跨文化研究。

The TWikiL dataset was created by the Department of Communication and Psychology at Aalborg University Copenhagen, and contains all Wikipedia links shared on Twitter between 2006 and 2021. In addition to recording the links themselves, the dataset enriches the information of the cited articles using Wikidata identifiers and Wikipedia topic categories. The TWikiL dataset is divided into a raw version and a curated version: the raw version includes the Tweet IDs of all Wikipedia links, while the curated version undergoes further filtering to only retain links to Wikipedia article pages. This dataset holds substantial scholarly value for researching the mutual relationship between Wikipedia and Twitter, information dissemination patterns, and the information ecology of social media, and is particularly well-suited for historical data analysis and cross-cultural research.
提供机构:
奥尔堡大学哥本哈根通信与心理学系
创建时间:
2022-01-15
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作