Wikipedia Clickstream
收藏DataCite Commons2020-09-04 更新2024-07-27 收录
下载链接:
https://figshare.com/articles/dataset/Wikipedia_Clickstream/1305770/20
下载链接
链接失效反馈官方服务:
资源简介:
This project contains data sets containing counts of (referer, resource) pairs extracted from the request logs of Wikipedia. A referer is an HTTP header field that identifies the address of the webpage that linked to the resource being requested. The data shows how people get to a Wikipedia article and what links they click on. In other words, it gives a weighted network of articles, where each edge weight corresponds to how often people navigate from one page to another. For more information and documentation, see the link in the references section below.
本项目包含从维基百科(Wikipedia)请求日志中提取的(引荐来源(referer),请求资源)对计数数据集。其中,引荐来源(referer)是一类HTTP标头字段,用于标识指向当前请求资源的网页地址。该数据集展现了用户访问维基百科条目的路径,以及他们所点击的链接。换言之,该数据集构建了一张带权的维基百科条目网络,其中每条边的权重对应用户从一个页面跳转至另一页面的频次。如需获取更多信息与文档,请参阅下文参考文献部分中的链接。
提供机构:
figshare
创建时间:
2016-10-13
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含维基百科多语言版本的点击流数据,记录了用户在不同文章间的导航路径,形成加权网络结构。数据以.tsv.gz格式存储,涵盖2015至2016年期间多个时间点的快照,适用于网络分析和用户行为研究。
以上内容由遇见数据集搜集并总结生成



