Malicious Paths List

github2025-01-24 更新2025-02-16 收录

下载链接：

https://github.com/TarikSudo/malicious-paths-list

下载链接

链接失效反馈

官方服务：

资源简介：

这个数据集包含了4500多个常被攻击者和机器人使用的恶意网页路径。这些路径是从2024年11月20日至2025年1月5日记录的，期间记录了超过80,000个请求，最近30天内记录了超过35,000个请求。这些请求是在没有先前活动的全新域名上捕获的，确保所有请求都是未经请求和不需要的。

This dataset contains over 4,500 malicious web paths commonly exploited by attackers and bots. These paths were recorded between November 20, 2024 and January 5, 2025, during which more than 80,000 requests were captured. Over 35,000 of these requests were logged within the most recent 30-day period. All requests were captured on entirely new domains with no prior activity, ensuring that all incoming requests were unsolicited and unwanted.

创建时间：

2025-01-24

原始信息汇总

Malicious Paths List 数据集概述

数据集简介

数据集名称：Malicious Paths List
数据集大小：4,500+ 恶意Web路径
数据收集时间：2024年11月20日至2025年1月5日
请求记录：超过80,000次请求，其中最近30天内超过35,000次
数据来源：捕获于无先前活动的新域名，确保所有请求都是未经请求和不需要的

数据集用途

分析目标：识别针对漏洞或尝试利用Web服务器的路径，用于提高安全性和减少服务器负载

使用场景

适用网站：具有动态或复杂结构的网站
不适用场景：
- 小型已知有效路径集合的网站（如静态网站或API）
- 推荐默认阻止所有流量，仅显式允许有效路径

阻止路径的好处

增强安全性：减少针对特定漏洞的攻击风险
提高效率：节省服务器资源，如带宽和处理器功率
优化网络流量：减少到达Web服务器的流量，降低网络和服务器负载

实施建议

CDN级别阻止：使用类似Cloudflare的服务过滤恶意路径
服务器级别阻止：使用Web应用防火墙（WAF）或自定义脚本

关于IP地址

隐私考虑：数据集中未包含访问者IP地址，以尊重隐私

数据集预览

数据截图：展示了数据集的外观

Traffic Summary

Dataset Screenshot

搜集汇总

数据集介绍

构建方式

Malicious Paths List数据集的构建基于对新型无活动域上捕获的请求进行日志记录，时间跨度从2024年11月20日至2025年1月5日。在此期间，共记录了80,000多个请求，其中35,000多个请求发生在最后30天内。通过分析这些日志，研究者识别出了一系列针对漏洞或试图利用web服务器的恶意路径，从而构建了本数据集。

特点

该数据集包含4500多条常见的恶意web路径，这些路径被攻击者和机器人广泛使用。所有记录的请求均为未经请求且不受欢迎的，因为它们是在没有任何先前活动的全新域名上捕获的。数据集针对性强，适用于动态或复杂结构的网站，以提高安全性和减少服务器负载。

使用方法

使用该数据集时，推荐结合Web应用防火墙(WAF)或在CDN级别（如Cloudflare）进行恶意路径的过滤，以优化网络安全和服务器效率。此外，为尊重隐私，数据集中并未包含访问者的IP地址，建议使用者结合IP2Location等代理检测服务以增强防护效果。

背景与挑战

背景概述

Malicious Paths List数据集创建于2024年末至2025年初，旨在记录并分析恶意网络路径，该数据集由研究人员通过对新域名上未经请求的恶意网络请求进行捕获和整理而形成。该数据集涵盖了4500多条常见的攻击者和机器人使用的恶意路径，记录了超过80,000次请求，对于提升网络安全、减轻服务器负载具有重要作用。它不仅反映了网络安全的现实挑战，也为网络安全防护策略的制定提供了实证基础。

当前挑战

该数据集在构建和应用过程中面临的挑战主要包括：如何准确识别和分类恶意路径以增强数据集的实用性；在保护隐私的前提下，有效整合IP地址信息以提升网络安全防护的精准度；以及如何在保证服务器性能的前提下，对大量恶意路径进行有效阻断。此外，数据集在应用中还面临如何适应不同网站结构（如静态网站与API）的安全需求，以及如何与现有网络安全工具如CDN和WAF集成以优化网络流量的挑战。

常用场景

经典使用场景

在网络安全领域，Malicious Paths List数据集的典型应用场景在于为网络安全研究人员提供了一组用于检测和防御恶意网络请求的路径列表。通过对这些恶意路径的分析和利用，研究人员能够有效地模拟攻击者的行为，进而加强网络安全防护措施。

实际应用

在实际应用中，Malicious Paths List数据集可被用于网站安全防护，通过在CDN层面或服务器层面拦截这些已知的恶意路径，网站管理员能够减少不必要的网络流量，提高服务器效率，同时降低被攻击的风险。

衍生相关工作

基于该数据集，已经衍生出一系列相关工作，包括但不限于开发更为高效的恶意请求识别算法、构建自动化安全检测系统，以及结合其他数据源如IP地址分析，形成多层次的网络防护策略。这些工作进一步扩展了数据集的应用范围，提升了网络空间安全的研究深度和广度。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集