five

Geographic distribution of Wikimedia traffic

收藏
DataCite Commons2020-09-04 更新2024-07-25 收录
下载链接:
https://figshare.com/articles/dataset/Geographic_distribution_of_Wikimedia_traffic/1317408/1
下载链接
链接失效反馈
官方服务:
资源简介:
This dataset contains the proportion of traffic to each public Wikimedia project, from each known country, with some caveats. This dataset represents an aggregate of 1:1000 sampled pageviews from the entirety of 2014. The pageviews definition applied was the Foundation's new pageviews definition; additionally, spiders and similar automata were filtered out with Tobie's ua-parser. Geolocation was then performed using MaxMind's geolocation products. There are no privacy implications that we could identify; The data comes from 1:1000 sampled logs, is proportionate rather than raw, and aggregates any nations with &lt;1% of a project's pageviews under 'Other'. <br>It is released into the public domain under the CC-0 public domain dedication

本数据集包含来自各已知国家的流量在各公开维基媒体项目中的占比情况,同时附带相关限定说明。该数据集是对2014年全年全部页面浏览量(pageviews)数据进行1:1000采样后聚合得到的成果。本次采用的页面浏览量统计口径为维基媒体基金会最新发布的标准;此外,我们通过Tobie开发的ua-parser工具过滤了爬虫及类似自动程序的访问记录。地理位置信息依托MaxMind的地理定位产品完成解析。经核查,本数据集不存在可识别的隐私风险:其数据来源于1:1000采样的日志文件,以占比形式存储而非原始数据,同时将占某一项目页面浏览量比例不足1%的国家聚合归类至“其他(Other)”类目下。 本数据集基于CC0公共领域贡献协议发布,已进入公共领域。
提供机构:
figshare
创建时间:
2016-01-19
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作