phishdestroy/destroylist

Name: phishdestroy/destroylist
Creator: phishdestroy
Published: 2026-04-11 19:30:19
License: 暂无描述

Hugging Face2026-04-11 更新2026-03-29 收录

下载链接：

https://hf-mirror.com/datasets/phishdestroy/destroylist

下载链接

链接失效反馈

官方服务：

资源简介：

--- tags: - phishing - cybersecurity - threat-intelligence - crypto-scam - blocklist - malware - fraud-detection - domain-security license: mit language: - en task_categories: - text-classification size_categories: - 100K<n<1M pretty_name: "PhishDestroy - Real-time Phishing & Crypto Scam Domain Blocklist" --- # PhishDestroy Blocklist Dataset Real-time feed of phishing, crypto drainer, and scam domains detected by [PhishDestroy](https://phishdestroy.io). **Updated hourly from GitHub.** ## Statistics | Metric | Count | |--------|-------| | Total Domains | 127,075 | | DNS Active | 68,717 | | Content Active | 69,575 | | Dead Domains | 58,075 | | Community Blocklist | 872,287 | | Added Today | 4 | | Added This Week | 4 | *Last updated: 2026-04-11 19:30 UTC* ## Files | File | Description | |------|-------------| | `list.json` | Full domain list (JSON array) | | `domains.txt` | Plain text, one domain per line | | `urls.txt` | Full URLs with protocol | | `domains.csv` | ML-ready CSV with metadata | | `dns/active_domains.json` | DNS-verified active domains | | `dns/content_active.json` | Domains with verified malicious content | | `dns/dead_domains.json` | Inactive/dead domains | | `dns/today_added.json` | New domains added today | | `dns/week_added.json` | New domains this week | | `community/blocklist.json` | Community-submitted blocklist | | `community/live_blocklist.json` | Community verified live | ## Usage ### Python (datasets) ```python from datasets import load_dataset # Load full dataset ds = load_dataset("phishdestroy/destroylist") # Or load specific file import json from huggingface_hub import hf_hub_download path = hf_hub_download( repo_id="phishdestroy/destroylist", filename="list.json", repo_type="dataset" ) with open(path) as f: domains = json.load(f) ``` ### Pandas ```python import pandas as pd from huggingface_hub import hf_hub_download path = hf_hub_download( repo_id="phishdestroy/destroylist", filename="domains.csv", repo_type="dataset" ) df = pd.read_csv(path) print(df.head()) ``` ### curl ```bash # Download domains list curl -L https://huggingface.co/datasets/phishdestroy/destroylist/resolve/main/domains.txt # Download as JSON curl -L https://huggingface.co/datasets/phishdestroy/destroylist/resolve/main/list.json ``` ## Links - Website: [phishdestroy.io](https://phishdestroy.io) - API: [api.destroy.tools](https://api.destroy.tools) - GitHub: [github.com/phishdestroy/destroylist](https://github.com/phishdestroy/destroylist) - AlienVault OTX: [OTX Pulse](https://otx.alienvault.com/pulse/69c081afa2bd54a9599b7c07) ## License MIT License - Free for commercial and non-commercial use. ## Citation ```bibtex @dataset{phishdestroy_blocklist, title = {PhishDestroy Blocklist}, author = {PhishDestroy Team}, year = {2024}, url = {https://huggingface.co/datasets/phishdestroy/destroylist} } ```

提供机构：

phishdestroy

搜集汇总

数据集介绍

构建方式

在网络安全领域，实时威胁情报的收集与整合对防御钓鱼攻击至关重要。PhishDestroy Blocklist数据集通过自动化监测系统，持续捕获全球范围内的钓鱼网站、加密货币诈骗及恶意域名。其构建过程融合了多源数据流，包括主动DNS探测、内容验证机制以及社区众包反馈，每小时从GitHub仓库同步更新，确保数据的新鲜度与时效性。数据集不仅包含基础域名列表，还通过结构化处理生成了带有元数据的CSV文件及JSON格式的细分分类，如活跃域名、失效域名及社区提交的拦截列表，为研究与应用提供了多维度的数据支撑。

使用方法

在应用层面，该数据集为网络安全研究与实践提供了便捷的接入方式。用户可通过Hugging Face的datasets库直接加载完整数据集，或利用huggingface_hub工具下载特定文件，如list.json或domains.csv，以便于在Python环境中进行数据处理。对于数据分析任务，可借助Pandas库读取CSV格式文件，快速构建数据框架以开展特征探索或模型训练。同时，数据集支持通过curl命令直接获取原始文本或JSON文件，便于集成到自动化脚本或安全系统中。这种灵活的多语言支持与标准化接口设计，显著降低了数据使用的技术门槛，促进了其在威胁检测、欺诈分析等场景中的实际应用。

背景与挑战

背景概述

随着网络钓鱼和加密货币诈骗活动的日益猖獗，网络安全领域亟需高效、实时的威胁情报资源。PhishDestroy Blocklist数据集应运而生，由PhishDestroy团队于2024年创建并维护，其核心研究问题聚焦于动态识别与聚合恶意域名，涵盖钓鱼网站、加密资产盗取及欺诈行为。该数据集通过每小时更新的机制，整合了超过11万个域名及其元数据，为威胁检测、域名安全及欺诈预防研究提供了关键数据支撑，显著提升了相关领域对新兴网络威胁的响应速度与防御能力。

当前挑战

该数据集致力于解决网络钓鱼与加密货币诈骗检测中的领域挑战，包括恶意域名的快速演化、隐蔽性增强以及跨平台传播复杂性，要求模型具备高时效性与强泛化能力。在构建过程中，团队面临实时数据采集与验证的困难，需平衡域名活跃状态监测的准确性与数据更新频率；同时，社区贡献数据的质量参差不齐，增加了数据清洗与去噪的复杂度，确保最终数据集的可靠性与实用性成为持续的技术难点。

常用场景

经典使用场景

在网络安全领域，钓鱼攻击与加密货币诈骗已成为日益猖獗的威胁，PhishDestroy Blocklist数据集凭借其实时更新的特性，为恶意域名检测提供了关键支持。该数据集最经典的使用场景在于训练和评估基于机器学习的文本分类模型，特别是针对域名和URL的恶意性识别。研究人员利用其丰富的域名列表和元数据，构建分类器以自动区分合法与欺诈性网络资源，从而提升检测系统的准确性和响应速度。

解决学术问题

该数据集有效解决了网络安全研究中恶意域名识别数据稀缺且时效性不足的学术难题。通过提供大规模、实时更新的钓鱼与诈骗域名样本，它支持了领域自适应、少样本学习以及威胁情报动态建模等前沿研究。其意义在于推动了检测算法从静态规则向动态智能分析的演进，为构建鲁棒性更强的网络安全防御体系奠定了数据基础，显著提升了学术研究的实用价值与影响力。

实际应用

在实际应用层面，PhishDestroy Blocklist数据集被广泛集成于企业安全产品、网络防火墙以及浏览器扩展程序中，用于实时拦截和预警恶意网络访问。安全团队利用其提供的社区验证列表和活跃域名信息，增强威胁狩猎能力，快速响应新兴网络攻击。此外，该数据集还为加密货币平台和金融机构的欺诈检测系统提供了关键数据源，帮助保护用户资产免受钓鱼和引流攻击的侵害。

数据集最近研究