five

zhanfwei-0226/phreshphish

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/zhanfwei-0226/phreshphish
下载链接
链接失效反馈
官方服务:
资源简介:
PhreshPhish是一个用于钓鱼网页检测的大规模、真实世界的数据集和基准测试,包含钓鱼和良性HTML-URL对。训练集有498,255个样本(276,729个良性样本和221,526个钓鱼样本),测试集有168,060个样本(91,260个良性样本和76,876个钓鱼样本)。此外,还提供了975个基准测试,基准率范围从[5e-4, 1e-3, 5e-3, 1e-2, 5e-2]。数据集的使用仅限于反钓鱼研究,并遵循Creative Commons Attribution 4.0 International许可。

PhreshPhish is a large-scale, real-world dataset and benchmark for phishing webpage detection containing phishing and benign HTML-URL pairs. The train set has 498,255 samples: 276,729 benign and 221,526 phish, and the test set has 168,060 samples: 91,260 benign and 76,876 phish. Additionally, it includes 975 benchmarks with base rates ranging from [5e-4, 1e-3, 5e-3, 1e-2, 5e-2]. The dataset is released under Creative Commons Attribution 4.0 International license and should only be used for anti-phishing research.
提供机构:
zhanfwei-0226
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作