BRON
收藏arXiv2021-08-05 更新2024-06-21 收录
下载链接:
http://bron.alfa.csail.mit.edu
下载链接
链接失效反馈官方服务:
资源简介:
BRON数据集是由麻省理工学院计算机科学与人工智能实验室开发的一个综合网络安全数据集,旨在通过整合公共威胁和漏洞行为源来支持AI和ML算法在网络安全建模和推断中的应用。该数据集包含666个技术条目和740个攻击模式,通过图数据库形式存储,便于快速查询和更新。BRON数据集的应用领域广泛,包括威胁技术预测、攻击模式识别以及网络安全行为的模拟和分析,旨在提高网络安全防御的效率和效果。
The BRON dataset is a comprehensive cybersecurity dataset developed by the MIT Computer Science and Artificial Intelligence Laboratory (CSAIL). It is designed to support the application of AI and ML algorithms in cybersecurity modeling and inference by integrating public threat and vulnerability behavior sources. This dataset contains 666 technical entries and 740 attack patterns, and is stored in a graph database to facilitate rapid querying and updating. The BRON dataset covers a wide range of application domains, including threat technology prediction, attack pattern recognition, as well as the simulation and analysis of cybersecurity behaviors, with the aim of enhancing the efficiency and effectiveness of cybersecurity defense.
提供机构:
麻省理工学院计算机科学与人工智能实验室
创建时间:
2021-08-05
搜集汇总
数据集介绍

构建方式
在网络安全领域,行为层面的威胁建模与漏洞分析依赖于多元异构数据源的整合。BRON数据集通过系统化集成四大权威公共知识库——MITRE ATT&CK矩阵、CAPEC攻击模式枚举、CWE通用弱点枚举及NIST CVE通用漏洞披露,构建为统一的图数据库。该构建过程保留了原始数据条目间的语义关联,并创新性地添加双向链接以增强查询效率,形成覆盖攻击战术、技术、弱点与漏洞的多维关联网络,为行为级安全分析提供结构化知识基础。
特点
BRON的核心特征体现在其高度结构化与关联性的知识表示。数据集以图结构融合威胁行为与漏洞信息,节点涵盖战术、技术、攻击模式、弱点及漏洞实体,边则表征实体间的逻辑关联。这种设计不仅支持复杂的跨域查询,还通过自然语言描述赋予语义可解释性。数据集的动态更新机制确保其与安全威胁演进同步,而稀疏连接的图特性则揭示了未报告关联的推断空间,为机器学习模型提供了隐含关系挖掘的独特场景。
使用方法
BRON的应用方法围绕其图结构与多源集成特性展开。在信息检索层面,用户可通过图遍历查询特定弱点关联的攻击模式或技术路径,辅助威胁评估。机器学习应用中,可将节点文本特征与图拓扑属性结合,训练链接预测模型以推断潜在威胁关联。在模拟推演领域,数据集支持构建攻击-防御协同演化模型,基于CVSS评分量化对抗效果。此外,BRON可作为自动化攻击规划的知識库,生成多阶段攻击图以评估系统韧性,实现从静态分析到动态推演的多层次安全研究。
背景与挑战
背景概述
在网络安全领域,行为层面的威胁建模与推理正成为人工智能与机器学习技术的重要应用方向。BRON数据集由麻省理工学院计算机科学与人工智能实验室的Erik Hemberg与Una-May O'Reilly等研究人员于2020年构建,并于2021年正式发布。该数据集的核心目标在于整合来自MITRE ATT&CK、CAPEC、CWE及NIST CVE等公开威胁与漏洞行为源的信息,构建一个统一的图数据库,以支持对攻击者战术、技术与程序(TTPs)以及系统弱点之间关联性的高级分析。BRON的创建旨在弥补传统基于指标的安全检测与行为级AI建模之间的鸿沟,为预测相关威胁技术、攻击模式以及自动化红队演练等任务提供结构化知识基础,显著推动了行为级网络安全分析的研究进展。
当前挑战
BRON数据集致力于解决行为级网络安全分析中的关联预测与知识整合问题,其核心挑战在于数据稀疏性与链接不完整性。由于数据集源自多个独立且更新频率各异的公开数据库,条目间的交叉引用往往依赖人工报告,导致实际记录的链接数量远低于理论可能,例如在技术与攻击模式之间仅存在0.032%的已知连接。这种高度稀疏的图结构使得机器学习模型在预测缺失边时面临特征表示与分类性能的严峻考验。在构建过程中,挑战主要体现为多源异构数据的融合与一致性维护,需要设计有效的图模式以统一不同数据库的语义差异,并确保双向链接的准确性与时效性,同时还需克服原始数据中存在的报告偏差与语义歧义,例如区分未报告链接与真实不存在的关联。
常用场景
经典使用场景
在网络安全领域,BRON数据集通过整合ATT&CK、CAPEC、CWE和CVE等公开威胁与漏洞数据库,构建了一个统一的知识图谱。该数据集最经典的使用场景在于支持基于行为层面的机器学习与人工智能建模,例如利用其图结构特征和自然语言信息,预测未报告的威胁技术与攻击模式之间的潜在关联,从而辅助安全专家进行威胁狩猎与漏洞分析。
衍生相关工作
基于BRON数据集,衍生出多项经典研究工作。例如,EvoAPT系统利用BRON中的威胁与漏洞数据模拟攻击模式与防御措施的协同演化;Attack Planner则通过BRON链接ATT&CK与CVE数据,生成细粒度攻击计划。此外,多项研究借助BRON进行图神经网络与自然语言处理的特征学习,推动了行为级网络安全人工智能方法的发展。
数据集最近研究
最新研究方向
在网络安全领域,随着高级持续性威胁(APT)的日益复杂化,行为层面的安全分析成为研究热点。BRON数据集通过整合ATT&CK、CAPEC、CWE和CVE等公开威胁与漏洞数据库,构建了一个关联图数据库,为机器学习与人工智能提供了结构化知识基础。当前研究聚焦于利用BRON进行模式推断,例如预测未报告的威胁技术与攻击模式之间的关联边,这有助于揭示潜在的攻击行为联系。同时,BRON支持信息检索、建模与仿真以及AI规划等应用,例如在进化算法中模拟攻击模式与防御措施的协同演化,为自动化红队测试和攻击图生成提供支持。这些研究方向不仅提升了行为级网络安全建模的精度,还推动了威胁狩猎和防御策略的智能化发展,具有重要的实践意义。
相关研究论文
- 1Using a Collated Cybersecurity Dataset for Machine Learning and Artificial Intelligence麻省理工学院计算机科学与人工智能实验室 · 2021年
以上内容由遇见数据集搜集并总结生成



