phishdestroy/destroylist
收藏Hugging Face2026-04-11 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/phishdestroy/destroylist
下载链接
链接失效反馈官方服务:
资源简介:
---
tags:
- phishing
- cybersecurity
- threat-intelligence
- crypto-scam
- blocklist
- malware
- fraud-detection
- domain-security
license: mit
language:
- en
task_categories:
- text-classification
size_categories:
- 100K<n<1M
pretty_name: "PhishDestroy - Real-time Phishing & Crypto Scam Domain Blocklist"
---
# PhishDestroy Blocklist Dataset
Real-time feed of phishing, crypto drainer, and scam domains detected by [PhishDestroy](https://phishdestroy.io).
**Updated hourly from GitHub.**
## Statistics
| Metric | Count |
|--------|-------|
| Total Domains | 127,075 |
| DNS Active | 68,717 |
| Content Active | 69,575 |
| Dead Domains | 58,075 |
| Community Blocklist | 872,287 |
| Added Today | 4 |
| Added This Week | 4 |
*Last updated: 2026-04-11 19:30 UTC*
## Files
| File | Description |
|------|-------------|
| `list.json` | Full domain list (JSON array) |
| `domains.txt` | Plain text, one domain per line |
| `urls.txt` | Full URLs with protocol |
| `domains.csv` | ML-ready CSV with metadata |
| `dns/active_domains.json` | DNS-verified active domains |
| `dns/content_active.json` | Domains with verified malicious content |
| `dns/dead_domains.json` | Inactive/dead domains |
| `dns/today_added.json` | New domains added today |
| `dns/week_added.json` | New domains this week |
| `community/blocklist.json` | Community-submitted blocklist |
| `community/live_blocklist.json` | Community verified live |
## Usage
### Python (datasets)
```python
from datasets import load_dataset
# Load full dataset
ds = load_dataset("phishdestroy/destroylist")
# Or load specific file
import json
from huggingface_hub import hf_hub_download
path = hf_hub_download(
repo_id="phishdestroy/destroylist",
filename="list.json",
repo_type="dataset"
)
with open(path) as f:
domains = json.load(f)
```
### Pandas
```python
import pandas as pd
from huggingface_hub import hf_hub_download
path = hf_hub_download(
repo_id="phishdestroy/destroylist",
filename="domains.csv",
repo_type="dataset"
)
df = pd.read_csv(path)
print(df.head())
```
### curl
```bash
# Download domains list
curl -L https://huggingface.co/datasets/phishdestroy/destroylist/resolve/main/domains.txt
# Download as JSON
curl -L https://huggingface.co/datasets/phishdestroy/destroylist/resolve/main/list.json
```
## Links
- Website: [phishdestroy.io](https://phishdestroy.io)
- API: [api.destroy.tools](https://api.destroy.tools)
- GitHub: [github.com/phishdestroy/destroylist](https://github.com/phishdestroy/destroylist)
- AlienVault OTX: [OTX Pulse](https://otx.alienvault.com/pulse/69c081afa2bd54a9599b7c07)
## License
MIT License - Free for commercial and non-commercial use.
## Citation
```bibtex
@dataset{phishdestroy_blocklist,
title = {PhishDestroy Blocklist},
author = {PhishDestroy Team},
year = {2024},
url = {https://huggingface.co/datasets/phishdestroy/destroylist}
}
```
提供机构:
phishdestroy
搜集汇总
数据集介绍

构建方式
在网络安全领域,实时威胁情报的收集与整合对防御钓鱼攻击至关重要。PhishDestroy Blocklist数据集通过自动化监测系统,持续捕获全球范围内的钓鱼网站、加密货币诈骗及恶意域名。其构建过程融合了多源数据流,包括主动DNS探测、内容验证机制以及社区众包反馈,每小时从GitHub仓库同步更新,确保数据的新鲜度与时效性。数据集不仅包含基础域名列表,还通过结构化处理生成了带有元数据的CSV文件及JSON格式的细分分类,如活跃域名、失效域名及社区提交的拦截列表,为研究与应用提供了多维度的数据支撑。
使用方法
在应用层面,该数据集为网络安全研究与实践提供了便捷的接入方式。用户可通过Hugging Face的datasets库直接加载完整数据集,或利用huggingface_hub工具下载特定文件,如list.json或domains.csv,以便于在Python环境中进行数据处理。对于数据分析任务,可借助Pandas库读取CSV格式文件,快速构建数据框架以开展特征探索或模型训练。同时,数据集支持通过curl命令直接获取原始文本或JSON文件,便于集成到自动化脚本或安全系统中。这种灵活的多语言支持与标准化接口设计,显著降低了数据使用的技术门槛,促进了其在威胁检测、欺诈分析等场景中的实际应用。
背景与挑战
背景概述
随着网络钓鱼和加密货币诈骗活动的日益猖獗,网络安全领域亟需高效、实时的威胁情报资源。PhishDestroy Blocklist数据集应运而生,由PhishDestroy团队于2024年创建并维护,其核心研究问题聚焦于动态识别与聚合恶意域名,涵盖钓鱼网站、加密资产盗取及欺诈行为。该数据集通过每小时更新的机制,整合了超过11万个域名及其元数据,为威胁检测、域名安全及欺诈预防研究提供了关键数据支撑,显著提升了相关领域对新兴网络威胁的响应速度与防御能力。
当前挑战
该数据集致力于解决网络钓鱼与加密货币诈骗检测中的领域挑战,包括恶意域名的快速演化、隐蔽性增强以及跨平台传播复杂性,要求模型具备高时效性与强泛化能力。在构建过程中,团队面临实时数据采集与验证的困难,需平衡域名活跃状态监测的准确性与数据更新频率;同时,社区贡献数据的质量参差不齐,增加了数据清洗与去噪的复杂度,确保最终数据集的可靠性与实用性成为持续的技术难点。
常用场景
经典使用场景
在网络安全领域,钓鱼攻击与加密货币诈骗已成为日益猖獗的威胁,PhishDestroy Blocklist数据集凭借其实时更新的特性,为恶意域名检测提供了关键支持。该数据集最经典的使用场景在于训练和评估基于机器学习的文本分类模型,特别是针对域名和URL的恶意性识别。研究人员利用其丰富的域名列表和元数据,构建分类器以自动区分合法与欺诈性网络资源,从而提升检测系统的准确性和响应速度。
解决学术问题
该数据集有效解决了网络安全研究中恶意域名识别数据稀缺且时效性不足的学术难题。通过提供大规模、实时更新的钓鱼与诈骗域名样本,它支持了领域自适应、少样本学习以及威胁情报动态建模等前沿研究。其意义在于推动了检测算法从静态规则向动态智能分析的演进,为构建鲁棒性更强的网络安全防御体系奠定了数据基础,显著提升了学术研究的实用价值与影响力。
实际应用
在实际应用层面,PhishDestroy Blocklist数据集被广泛集成于企业安全产品、网络防火墙以及浏览器扩展程序中,用于实时拦截和预警恶意网络访问。安全团队利用其提供的社区验证列表和活跃域名信息,增强威胁狩猎能力,快速响应新兴网络攻击。此外,该数据集还为加密货币平台和金融机构的欺诈检测系统提供了关键数据源,帮助保护用户资产免受钓鱼和引流攻击的侵害。
数据集最近研究
最新研究方向
在网络安全领域,钓鱼攻击与加密货币诈骗已成为全球性威胁,实时更新的恶意域名数据集为前沿研究提供了关键支撑。当前研究聚焦于利用此类动态数据流,结合机器学习与图神经网络技术,构建自适应威胁检测模型,以应对攻击者快速变换的规避策略。随着加密货币诈骗手段的演进,数据集被广泛应用于分析诈骗网络拓扑结构,揭示跨平台协同攻击模式,并推动自动化响应系统的开发。这些研究不仅提升了威胁情报的时效性与准确性,也为构建下一代主动防御体系奠定了数据基础,对保护数字资产与用户隐私具有深远意义。
以上内容由遇见数据集搜集并总结生成



