five

Tracking the Trackers

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/Tracking_the_Trackers
下载链接
链接失效反馈
官方服务:
资源简介:
跟踪跟踪器是对万维网上第三方跟踪器的大规模分析。我们从CommonCrawl 2012语料库的35亿多个网页中提取第三方嵌入,并将这些嵌入汇总到包含4100万多个域中的1.4亿多个第三方嵌入的数据集中。我们提供了最近对web上第三方跟踪器的大规模分析中使用的数据。我们创建了一个提取器,用于从HTML页面中查找嵌入的第三方资源,并在CommonCrawl 2012 web爬网中包含的35亿网页上运行它。
提供机构:
OpenDataLab
创建时间:
2022-05-23
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作