five

destroylist

收藏
Hugging Face2026-03-09 更新2026-03-10 收录
下载链接:
https://huggingface.co/datasets/phishdestroy/destroylist
下载链接
链接失效反馈
官方服务:
资源简介:
DestroyList 是一个社区驱动的网络钓鱼和诈骗数据库,旨在识别和分类各种在线威胁,包括钓鱼网站、加密货币诈骗、投资欺诈、技术支持诈骗和虚假在线商店。数据集包含多个文件:list.json(完整的钓鱼/诈骗数据库,包含 100,761 条记录)、active_domains.json(当前活跃的恶意域名)、domains.txt(纯文本域名列表,可用于阻止列表)和 urls.txt(报告的钓鱼网站的完整URL)。该数据集适用于安全研究和保护任务,可用于构建钓鱼网站检测系统、域名阻止列表等。用户可以通过 Python 加载数据集、直接下载文件或使用 domains.txt 作为 DNS 阻止列表。数据集每 6 小时从 GitHub 自动同步一次,由 PhishDestroy 维护,并明确用于保护用户免受在线威胁的合法目的。
创建时间:
2026-03-09
原始信息汇总

DestroyList - 钓鱼与诈骗数据库

数据集概述

DestroyList是一个社区驱动的数据库,用于识别和编录钓鱼网站、诈骗域名和欺诈性URL,旨在保护用户免受在线威胁。

数据库统计

  • list.json:包含100,761条记录,为完整的钓鱼/诈骗数据库。
  • active_domains.json:包含当前活跃的恶意域名(记录数量未明确)。
  • domains.txt:纯文本域名列表,适用于阻止列表。
  • urls.txt:包含已报告钓鱼网站的完整URL。

最后同步时间:2026-03-09 16:00:03 UTC

数据内容

数据库主要编录以下类型的在线威胁:

  • 冒充合法服务的钓鱼网站
  • 加密货币诈骗和虚假钱包
  • 投资欺诈计划
  • 技术支持诈骗
  • 虚假在线商店

使用方法

Python

python from datasets import load_dataset dataset = load_dataset("phishdestroy/destroylist") for record in dataset[train]: print(record)

直接下载

  • 仅下载活跃域名: curl -O https://huggingface.co/datasets/phishdestroy/destroylist/raw/main/active_domains.json
  • 下载完整数据库: curl -O https://huggingface.co/datasets/phishdestroy/destroylist/raw/main/list.json

DNS阻止列表

  • 将domains.txt文件用于Pi-hole、AdGuard等工具: curl -O https://huggingface.co/datasets/phishdestroy/destroylist/raw/main/domains.txt

数据来源与贡献

  • GitHub仓库:https://github.com/phishdestroy/destroylist
  • 报告钓鱼网站:可通过提交Issue或Pull Request进行贡献。

许可证与用途

此数据库仅供安全研究和防护目的使用,旨在负责任地保护用户免受在线威胁。

维护信息

  • 数据集每6小时从GitHub自动同步一次。
  • 由PhishDestroy维护(https://github.com/phishdestroy)。
搜集汇总
数据集介绍
main_image_url
构建方式
在网络安全领域,构建高质量的威胁情报数据库对于识别和防范网络欺诈至关重要。DestroyList数据集通过社区驱动的协作模式,持续收集并整合全球用户报告的钓鱼网站、诈骗域名及欺诈性URL。该数据集采用自动化同步机制,每六小时从GitHub仓库更新一次,确保信息的时效性。数据以结构化JSON格式存储,涵盖超过十万条记录,同时提供活跃域名列表和纯文本格式的域名与URL文件,便于不同场景下的分析与应用。
特点
DestroyList数据集展现出鲜明的社区协作与动态更新特性。其内容覆盖多种网络欺诈类型,包括仿冒合法服务的钓鱼网站、加密货币诈骗、投资欺诈及技术支持骗局等,具有广泛的代表性。数据集提供多种格式的输出,如完整的JSON数据库、活跃域名列表以及适用于DNS屏蔽工具的纯文本文件,兼顾了研究便捷性与实际部署需求。通过定期同步机制,数据集能够反映当前网络威胁的最新态势,为安全防护提供实时支持。
使用方法
该数据集为网络安全研究和防护实践提供了灵活的应用途径。研究人员可通过Hugging Face的`datasets`库直接加载数据集,利用Python进行批量分析与模型训练。对于实际部署,用户可直接下载`domains.txt`或`urls.txt`文件,将其集成到Pi-hole、AdGuard等DNS过滤系统中,以构建有效的网络屏蔽列表。此外,数据集支持通过GitHub提交新报告,鼓励社区共同参与威胁情报的扩充与维护,形成持续演进的防护生态。
背景与挑战
背景概述
DestroyList数据集由PhishDestroy社区于2026年维护,作为一个社区驱动的网络威胁情报库,专注于收集和整理网络钓鱼网站、诈骗域名及欺诈性URL。该数据集的核心研究问题在于应对日益复杂的网络欺诈行为,通过众包机制实时更新恶意实体信息,为网络安全研究与实践提供关键数据支持。其影响力体现在增强在线防护系统的实时性与准确性,助力开发更有效的反钓鱼与反诈骗技术,推动安全领域的协同防御生态构建。
当前挑战
在解决网络钓鱼与诈骗检测这一领域问题时,DestroyList面临恶意实体动态演化与隐蔽性增强的挑战,例如诈骗网站频繁更换域名或采用HTTPS加密以规避传统检测。数据集构建过程中,挑战主要源于数据源的可靠性与时效性维护,需通过社区贡献机制持续验证条目真实性,并处理海量异构数据(如JSON与文本格式)的标准化整合,以确保信息同步的准确性与完整性。
常用场景
经典使用场景
在网络安全领域,DestroyList数据集广泛应用于恶意网站检测与分类任务。研究者利用该数据集训练机器学习模型,以识别钓鱼网站、诈骗域名等网络威胁,通过分析URL结构、域名特征和内容模式,构建高效的自动化检测系统,为网络防护提供数据支撑。
解决学术问题
该数据集解决了网络威胁情报分析中的关键问题,如钓鱼网站的实时识别、诈骗模式的演化追踪以及恶意域名的群体行为研究。其大规模标注数据为学术研究提供了基准,推动了异常检测、自然语言处理在安全领域的应用,并促进了跨学科的安全分析方法发展。
衍生相关工作
基于DestroyList衍生的经典工作包括钓鱼网站检测模型的优化研究、诈骗域名图神经网络分析以及自动化威胁情报平台开发。这些研究不仅提升了恶意内容识别的准确率,还推动了开源安全社区的协作,为后续的大规模网络威胁数据库建设奠定了基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作