five

2012 WDC Hyperlink Graph

收藏
webdatacommons.org2025-03-23 收录
下载链接:
http://webdatacommons.org/hyperlinkgraph/2012-08/topology.html
下载链接
链接失效反馈
官方服务:
资源简介:
This dataset contains the hyperlink graph extracted from the Common Crawl 2012 web corpus. The graph covers 3.5 billion web pages and 128 billion hyperlinks between these pages.

本数据集收录了从2012年Common Crawl网络语料库中提取的超链接图。该图涵盖了35亿个网页以及这些网页之间相互连接的1280亿个超链接。
提供机构:
webdatacommons.org
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作