Wiki Squirrel (Wikipedia Squirrel)
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Wiki_Squirrel
下载链接
链接失效反馈官方服务:
资源简介:
数据来自英文维基百科(2018 年 12 月)。这些数据集代表特定主题(变色龙、鳄鱼和松鼠)的页面网络。节点代表文章,边是它们之间的相互联系。边缘 csv 文件包含边缘 - 节点从 0 开始索引。特征 json 文件包含文章的特征 - 每个键是一个页面 id,节点特征以列表形式给出。特征列表中的特征的存在意味着信息名词出现在维基百科文章的文本中。目标 csv 包含每个页面的节点标识符和 2017 年 10 月至 2018 年 11 月之间的平均每月流量。对于每个页页网络,我们列出了节点数和边数以及其他一些描述性统计数据。
The data is sourced from the English Wikipedia (December 2018). These datasets represent page networks for three specific topics: chameleons, crocodiles, and squirrels. Nodes represent Wikipedia articles, while edges denote the mutual links between them. The edges CSV file stores the graph edges, with nodes indexed starting from 0. The features JSON file contains article features: each key corresponds to a page ID, and node features are provided as a list. The presence of a feature in the list indicates that the corresponding informational noun appears in the text of the respective Wikipedia article. The targets CSV file contains the node identifier for each page and the average monthly page traffic between October 2017 and November 2018. For each of these page networks, we document the number of nodes, the number of edges, and several additional descriptive statistics.
提供机构:
OpenDataLab
创建时间:
2022-08-19
搜集汇总
数据集介绍

背景与挑战
背景概述
Wiki Squirrel数据集是一个基于英文维基百科的图网络数据集,包含特定主题的页面网络、文章特征和流量数据,适用于图网络节点分类任务。
以上内容由遇见数据集搜集并总结生成



