destroylist
收藏Hugging Face2026-03-09 更新2026-03-10 收录
下载链接:
https://huggingface.co/datasets/phishdestroy/destroylist
下载链接
链接失效反馈官方服务:
资源简介:
DestroyList 是一个社区驱动的网络钓鱼和诈骗数据库,旨在识别和分类各种在线威胁,包括钓鱼网站、加密货币诈骗、投资欺诈、技术支持诈骗和虚假在线商店。数据集包含多个文件:list.json(完整的钓鱼/诈骗数据库,包含 100,761 条记录)、active_domains.json(当前活跃的恶意域名)、domains.txt(纯文本域名列表,可用于阻止列表)和 urls.txt(报告的钓鱼网站的完整URL)。该数据集适用于安全研究和保护任务,可用于构建钓鱼网站检测系统、域名阻止列表等。用户可以通过 Python 加载数据集、直接下载文件或使用 domains.txt 作为 DNS 阻止列表。数据集每 6 小时从 GitHub 自动同步一次,由 PhishDestroy 维护,并明确用于保护用户免受在线威胁的合法目的。
创建时间:
2026-03-09
原始信息汇总
DestroyList - 钓鱼与诈骗数据库
数据集概述
DestroyList是一个社区驱动的数据库,用于识别和编录钓鱼网站、诈骗域名和欺诈性URL,旨在保护用户免受在线威胁。
数据库统计
- list.json:包含100,761条记录,为完整的钓鱼/诈骗数据库。
- active_domains.json:包含当前活跃的恶意域名(记录数量未明确)。
- domains.txt:纯文本域名列表,适用于阻止列表。
- urls.txt:包含已报告钓鱼网站的完整URL。
最后同步时间:2026-03-09 16:00:03 UTC
数据内容
数据库主要编录以下类型的在线威胁:
- 冒充合法服务的钓鱼网站
- 加密货币诈骗和虚假钱包
- 投资欺诈计划
- 技术支持诈骗
- 虚假在线商店
使用方法
Python
python from datasets import load_dataset dataset = load_dataset("phishdestroy/destroylist") for record in dataset[train]: print(record)
直接下载
- 仅下载活跃域名:
curl -O https://huggingface.co/datasets/phishdestroy/destroylist/raw/main/active_domains.json - 下载完整数据库:
curl -O https://huggingface.co/datasets/phishdestroy/destroylist/raw/main/list.json
DNS阻止列表
- 将domains.txt文件用于Pi-hole、AdGuard等工具:
curl -O https://huggingface.co/datasets/phishdestroy/destroylist/raw/main/domains.txt
数据来源与贡献
- GitHub仓库:https://github.com/phishdestroy/destroylist
- 报告钓鱼网站:可通过提交Issue或Pull Request进行贡献。
许可证与用途
此数据库仅供安全研究和防护目的使用,旨在负责任地保护用户免受在线威胁。
维护信息
- 数据集每6小时从GitHub自动同步一次。
- 由PhishDestroy维护(https://github.com/phishdestroy)。
搜集汇总
数据集介绍

构建方式
在网络安全领域,构建高质量的威胁情报数据库对于识别和防范网络欺诈至关重要。DestroyList数据集通过社区驱动的协作模式,持续收集并整合全球用户报告的钓鱼网站、诈骗域名及欺诈性URL。该数据集采用自动化同步机制,每六小时从GitHub仓库更新一次,确保信息的时效性。数据以结构化JSON格式存储,涵盖超过十万条记录,同时提供活跃域名列表和纯文本格式的域名与URL文件,便于不同场景下的分析与应用。
特点
DestroyList数据集展现出鲜明的社区协作与动态更新特性。其内容覆盖多种网络欺诈类型,包括仿冒合法服务的钓鱼网站、加密货币诈骗、投资欺诈及技术支持骗局等,具有广泛的代表性。数据集提供多种格式的输出,如完整的JSON数据库、活跃域名列表以及适用于DNS屏蔽工具的纯文本文件,兼顾了研究便捷性与实际部署需求。通过定期同步机制,数据集能够反映当前网络威胁的最新态势,为安全防护提供实时支持。
使用方法
该数据集为网络安全研究和防护实践提供了灵活的应用途径。研究人员可通过Hugging Face的`datasets`库直接加载数据集,利用Python进行批量分析与模型训练。对于实际部署,用户可直接下载`domains.txt`或`urls.txt`文件,将其集成到Pi-hole、AdGuard等DNS过滤系统中,以构建有效的网络屏蔽列表。此外,数据集支持通过GitHub提交新报告,鼓励社区共同参与威胁情报的扩充与维护,形成持续演进的防护生态。
背景与挑战
背景概述
DestroyList数据集由PhishDestroy社区于2026年维护,作为一个社区驱动的网络威胁情报库,专注于收集和整理网络钓鱼网站、诈骗域名及欺诈性URL。该数据集的核心研究问题在于应对日益复杂的网络欺诈行为,通过众包机制实时更新恶意实体信息,为网络安全研究与实践提供关键数据支持。其影响力体现在增强在线防护系统的实时性与准确性,助力开发更有效的反钓鱼与反诈骗技术,推动安全领域的协同防御生态构建。
当前挑战
在解决网络钓鱼与诈骗检测这一领域问题时,DestroyList面临恶意实体动态演化与隐蔽性增强的挑战,例如诈骗网站频繁更换域名或采用HTTPS加密以规避传统检测。数据集构建过程中,挑战主要源于数据源的可靠性与时效性维护,需通过社区贡献机制持续验证条目真实性,并处理海量异构数据(如JSON与文本格式)的标准化整合,以确保信息同步的准确性与完整性。
常用场景
经典使用场景
在网络安全领域,DestroyList数据集广泛应用于恶意网站检测与分类任务。研究者利用该数据集训练机器学习模型,以识别钓鱼网站、诈骗域名等网络威胁,通过分析URL结构、域名特征和内容模式,构建高效的自动化检测系统,为网络防护提供数据支撑。
解决学术问题
该数据集解决了网络威胁情报分析中的关键问题,如钓鱼网站的实时识别、诈骗模式的演化追踪以及恶意域名的群体行为研究。其大规模标注数据为学术研究提供了基准,推动了异常检测、自然语言处理在安全领域的应用,并促进了跨学科的安全分析方法发展。
衍生相关工作
基于DestroyList衍生的经典工作包括钓鱼网站检测模型的优化研究、诈骗域名图神经网络分析以及自动化威胁情报平台开发。这些研究不仅提升了恶意内容识别的准确率,还推动了开源安全社区的协作,为后续的大规模网络威胁数据库建设奠定了基础。
以上内容由遇见数据集搜集并总结生成



