destroylist

Hugging Face2026-03-09 更新2026-03-10 收录

下载链接：

https://huggingface.co/datasets/phishdestroy/destroylist

下载链接

链接失效反馈

官方服务：

资源简介：

DestroyList 是一个社区驱动的网络钓鱼和诈骗数据库，旨在识别和分类各种在线威胁，包括钓鱼网站、加密货币诈骗、投资欺诈、技术支持诈骗和虚假在线商店。数据集包含多个文件：list.json（完整的钓鱼/诈骗数据库，包含 100,761 条记录）、active_domains.json（当前活跃的恶意域名）、domains.txt（纯文本域名列表，可用于阻止列表）和 urls.txt（报告的钓鱼网站的完整URL）。该数据集适用于安全研究和保护任务，可用于构建钓鱼网站检测系统、域名阻止列表等。用户可以通过 Python 加载数据集、直接下载文件或使用 domains.txt 作为 DNS 阻止列表。数据集每 6 小时从 GitHub 自动同步一次，由 PhishDestroy 维护，并明确用于保护用户免受在线威胁的合法目的。

创建时间：

2026-03-09

原始信息汇总

DestroyList - 钓鱼与诈骗数据库

数据集概述

DestroyList是一个社区驱动的数据库，用于识别和编录钓鱼网站、诈骗域名和欺诈性URL，旨在保护用户免受在线威胁。

数据库统计

list.json：包含100,761条记录，为完整的钓鱼/诈骗数据库。
active_domains.json：包含当前活跃的恶意域名（记录数量未明确）。
domains.txt：纯文本域名列表，适用于阻止列表。
urls.txt：包含已报告钓鱼网站的完整URL。

最后同步时间：2026-03-09 16:00:03 UTC

数据内容

数据库主要编录以下类型的在线威胁：

冒充合法服务的钓鱼网站
加密货币诈骗和虚假钱包
投资欺诈计划
技术支持诈骗
虚假在线商店

使用方法

Python

python from datasets import load_dataset dataset = load_dataset("phishdestroy/destroylist") for record in dataset[train]: print(record)

直接下载

仅下载活跃域名： curl -O https://huggingface.co/datasets/phishdestroy/destroylist/raw/main/active_domains.json
下载完整数据库： curl -O https://huggingface.co/datasets/phishdestroy/destroylist/raw/main/list.json

DNS阻止列表

将domains.txt文件用于Pi-hole、AdGuard等工具： curl -O https://huggingface.co/datasets/phishdestroy/destroylist/raw/main/domains.txt

数据来源与贡献

GitHub仓库：https://github.com/phishdestroy/destroylist
报告钓鱼网站：可通过提交Issue或Pull Request进行贡献。

许可证与用途

此数据库仅供安全研究和防护目的使用，旨在负责任地保护用户免受在线威胁。

维护信息

数据集每6小时从GitHub自动同步一次。
由PhishDestroy维护（https://github.com/phishdestroy）。

搜集汇总

数据集介绍

构建方式

在网络安全领域，构建高质量的威胁情报数据库对于识别和防范网络欺诈至关重要。DestroyList数据集通过社区驱动的协作模式，持续收集并整合全球用户报告的钓鱼网站、诈骗域名及欺诈性URL。该数据集采用自动化同步机制，每六小时从GitHub仓库更新一次，确保信息的时效性。数据以结构化JSON格式存储，涵盖超过十万条记录，同时提供活跃域名列表和纯文本格式的域名与URL文件，便于不同场景下的分析与应用。

特点

DestroyList数据集展现出鲜明的社区协作与动态更新特性。其内容覆盖多种网络欺诈类型，包括仿冒合法服务的钓鱼网站、加密货币诈骗、投资欺诈及技术支持骗局等，具有广泛的代表性。数据集提供多种格式的输出，如完整的JSON数据库、活跃域名列表以及适用于DNS屏蔽工具的纯文本文件，兼顾了研究便捷性与实际部署需求。通过定期同步机制，数据集能够反映当前网络威胁的最新态势，为安全防护提供实时支持。

使用方法

该数据集为网络安全研究和防护实践提供了灵活的应用途径。研究人员可通过Hugging Face的`datasets`库直接加载数据集，利用Python进行批量分析与模型训练。对于实际部署，用户可直接下载`domains.txt`或`urls.txt`文件，将其集成到Pi-hole、AdGuard等DNS过滤系统中，以构建有效的网络屏蔽列表。此外，数据集支持通过GitHub提交新报告，鼓励社区共同参与威胁情报的扩充与维护，形成持续演进的防护生态。

背景与挑战

背景概述

DestroyList数据集由PhishDestroy社区于2026年维护，作为一个社区驱动的网络威胁情报库，专注于收集和整理网络钓鱼网站、诈骗域名及欺诈性URL。该数据集的核心研究问题在于应对日益复杂的网络欺诈行为，通过众包机制实时更新恶意实体信息，为网络安全研究与实践提供关键数据支持。其影响力体现在增强在线防护系统的实时性与准确性，助力开发更有效的反钓鱼与反诈骗技术，推动安全领域的协同防御生态构建。

当前挑战

在解决网络钓鱼与诈骗检测这一领域问题时，DestroyList面临恶意实体动态演化与隐蔽性增强的挑战，例如诈骗网站频繁更换域名或采用HTTPS加密以规避传统检测。数据集构建过程中，挑战主要源于数据源的可靠性与时效性维护，需通过社区贡献机制持续验证条目真实性，并处理海量异构数据（如JSON与文本格式）的标准化整合，以确保信息同步的准确性与完整性。

常用场景

经典使用场景

在网络安全领域，DestroyList数据集广泛应用于恶意网站检测与分类任务。研究者利用该数据集训练机器学习模型，以识别钓鱼网站、诈骗域名等网络威胁，通过分析URL结构、域名特征和内容模式，构建高效的自动化检测系统，为网络防护提供数据支撑。

解决学术问题

该数据集解决了网络威胁情报分析中的关键问题，如钓鱼网站的实时识别、诈骗模式的演化追踪以及恶意域名的群体行为研究。其大规模标注数据为学术研究提供了基准，推动了异常检测、自然语言处理在安全领域的应用，并促进了跨学科的安全分析方法发展。

衍生相关工作

基于DestroyList衍生的经典工作包括钓鱼网站检测模型的优化研究、诈骗域名图神经网络分析以及自动化威胁情报平台开发。这些研究不仅提升了恶意内容识别的准确率，还推动了开源安全社区的协作，为后续的大规模网络威胁数据库建设奠定了基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集