five

Attack-Technique-Dataset|网络安全数据集|攻击技术数据集

收藏
github2024-04-18 更新2024-05-31 收录
网络安全
攻击技术
下载链接:
https://github.com/NewBee119/Attack-Technique-Dataset
下载链接
链接失效反馈
资源简介:
一个包含APT组相关文章和MITRE ATT&CK技术描述的数据集,其中包括攻击技术的总结和详细描述,以及相关的APT组信息和威胁相关文章。

A dataset containing articles related to APT groups and MITRE ATT&CK technique descriptions, which includes summaries and detailed descriptions of attack techniques, as well as related APT group information and threat-related articles.
创建时间:
2019-08-12
原始信息汇总

Attack-Technique-Dataset 概述

数据集组成

MitreEnterprise.json

  • 包含从 https://attack.mitre.org/techniques/enterprise/ 收集的攻击技术概要。
  • 每项技术均包含描述和完整描述。

APTgroupMitre.json

  • 包含APT组织的概要及其使用的攻击技术和相关文章(参考资料)。
  • 数据收集自 https://attack.mitre.org/groups/。

tech_refer.json

  • 包含威胁相关文章的概要。
  • 每篇文章的URL可在APTgroupMitre.json中找到,并与MitreEnterprise.json中的多项技术相关联。

_id.txt

  • 为tech_refer.json中的每个URL分配一个ID。

references

  • 包含_id.txt中描述的文章(URL),文件名与_id.txt中描述的ID完全对应。
  • 文件类型为HTML,用户可使用deal_raw_file.py脚本进行分类。
  • 由于Github的限制,未上传所有文件,用户需使用get_file.py脚本下载文件。

references_processed

  • 提供一些预处理文件供用户使用。
AI搜集汇总
数据集介绍
main_image_url
构建方式
Attack-Technique-Dataset数据集的构建基于对高级持续性威胁(APT)组织相关文章和MITRE ATT&CK技术描述的系统性收集与整理。具体而言,数据集从MITRE ATT&CK官方网站获取了企业级攻击技术的详细信息,并将其整理为MitreEnterprise.json文件,每项技术均包含简要描述和完整说明。同时,APTgroupMitre.json文件汇总了APT组织及其使用的攻击技术,并附有相关文章的引用。此外,tech_refer.json文件提供了与这些技术相关的威胁文章摘要,而_id.txt文件则为每篇文章分配了唯一标识符。
使用方法
用户可以通过访问references文件夹中的HTML文件来获取原始文章,并使用提供的deal_raw_file.py脚本对这些文件进行分类处理。由于GitHub的文件大小限制,references文件夹中的内容并未完全上传,用户需使用get_file.py脚本自行下载所需文件。此外,references_processed文件夹中提供了部分预处理文件,便于用户快速上手分析。通过这些工具和文件,用户可以系统地研究APT组织及其使用的攻击技术,深入理解网络安全领域的复杂威胁。
背景与挑战
背景概述
随着高级持续性威胁(APT)攻击的日益复杂化,网络安全领域的研究者们面临着前所未有的挑战。Attack-Technique-Dataset数据集应运而生,旨在为研究者提供一个全面的APT攻击技术与相关文章的资源库。该数据集由主要研究人员或机构从MITRE ATT&CK框架中精心收集,涵盖了企业级攻击技术的详细描述以及APT组织的攻击手法。通过整合这些信息,研究者能够更深入地理解APT攻击的本质,从而开发出更为有效的防御策略。该数据集的创建不仅丰富了网络安全领域的研究资源,还为未来的安全技术发展奠定了坚实的基础。
当前挑战
尽管Attack-Technique-Dataset为APT攻击研究提供了宝贵的资源,但其构建过程中仍面临诸多挑战。首先,数据集的完整性依赖于对MITRE ATT&CK框架的持续更新,确保所有攻击技术与APT组织的关联信息保持最新。其次,由于APT攻击的隐蔽性和复杂性,收集和验证相关文章的真实性和准确性成为一大难题。此外,数据集的规模庞大,如何高效地处理和分类这些数据,以便研究者能够快速获取所需信息,也是一项技术挑战。最后,由于数据集涉及敏感的网络安全信息,确保数据的安全性和隐私保护同样不容忽视。
常用场景
经典使用场景
Attack-Technique-Dataset 数据集在网络安全领域中被广泛用于高级持续性威胁(APT)分析和攻击技术的研究。该数据集整合了MITRE ATT&CK框架中的企业级攻击技术描述以及APT组织使用的相关技术,为研究者提供了详尽的攻击技术信息和相关文献。通过分析这些数据,研究者能够深入理解不同APT组织的攻击策略,并识别出潜在的安全威胁。
解决学术问题
该数据集解决了网络安全领域中对APT攻击技术进行系统性分析的难题。通过提供详细的攻击技术描述和APT组织的使用情况,研究者能够更准确地识别和分类各种攻击手段,从而提升对复杂网络威胁的理解和防御能力。此外,数据集中的相关文献和URL链接为研究者提供了丰富的参考资料,有助于推动网络安全领域的学术研究。
实际应用
在实际应用中,Attack-Technique-Dataset 数据集被广泛用于网络安全防御系统的开发和优化。通过分析数据集中的攻击技术,安全专家能够设计出更加有效的防御策略,并针对特定的APT组织进行定制化的安全防护。此外,该数据集还被用于网络安全培训和教育,帮助安全从业人员更好地理解和应对复杂的网络攻击。
数据集最近研究
最新研究方向
在网络安全领域,Attack-Technique-Dataset 数据集的最新研究方向主要集中在高级持续性威胁(APT)攻击技术的深入分析与防御策略的优化上。该数据集通过整合MITRE ATT&CK框架中的企业级攻击技术描述与APT组织的实际攻击案例,为研究者提供了丰富的攻击模式与防御策略的对比分析素材。当前,研究者们正利用这一数据集探索如何通过机器学习与深度学习技术,自动化识别和预测潜在的APT攻击路径,从而提升网络安全防御的实时性与精准度。此外,该数据集还促进了跨领域的研究合作,如结合自然语言处理技术,从APT组织的相关文章中提取关键信息,进一步完善攻击技术的知识图谱,为未来的防御系统提供更为全面的情报支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国1km分辨率逐月降水量数据集(1901-2024)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2024.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

PadChest-GR dataset

<div> <div>PadChest-GR is a manually annotated, bilingual chest X-ray dataset designed to train and evaluate models for grounded radiology report generation. It includes bounding boxes and comprehensive annotations of all clinically relevant findings.</div> </div>

微软开源数据集 收录

全国医院名录

数据表格中的信息包含省、市、医院名称、医院地址、医院等级、日门诊量和特色专科。统计范围为全国34个省级行政区,统计时间为2019年。

国家基础学科公共科学数据中心 收录

OECD - Education at a Glance

该数据集提供了关于教育系统在不同国家和地区的详细统计数据,包括教育支出、教育参与率、教育成果、教师资源等多个方面。数据涵盖了OECD成员国以及部分非成员国。

www.oecd.org 收录

NUS-WIDE

NUS-WIDE 数据集包含从 Flickr 收集的 269,648 张图像,总共 5,018 个标签。这些图像是用 81 个概念手动注释的,包括对象和场景。

OpenDataLab 收录