Alexa Domains
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Alexa_Domains
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由前 100 万个网站的 URL 组成。
域名使用 Alexa 流量排名进行排名
是使用浏览行为的组合来确定的
网站上的用户数、唯一身份访问者的数量和网页浏览量。更详细地说,唯一身份访问者是
在给定日期访问网站的唯一用户数,
和 pageviews 是用户 URL 请求的总数
网站。但是,对同一网站的多个请求
在同一天被计为一次综合浏览量。网站
独立访问者和综合浏览量的最高组合
排名最高
This dataset comprises the URLs of the top 1 million websites. Domain names are ranked based on Alexa traffic rankings, which are determined using a combination of browsing-related metrics including the number of users on a website, the count of unique visitors, and pageviews. More specifically, unique visitors refer to the number of distinct users who accessed a website on a given date, while pageviews represent the total number of URL requests made by users to the website. However, multiple requests to the same website submitted on the same day are counted as a single pageview. Websites are ranked highest based on their combined metrics of independent visitors and pageviews.
提供机构:
OpenDataLab
创建时间:
2022-06-28
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含前100万个网站的URL,基于Alexa流量排名进行排序,排名依据用户数、唯一身份访问者和网页浏览量等指标。数据集主要用于网络安全研究,例如生成对抗攻击的示例,由博思艾伦汉密尔顿控股公司于2019年发布,相关论文为《Domaingan: generating adversarial examples to attack domain generation algorithm classifiers》。
以上内容由遇见数据集搜集并总结生成



