Vanessasml/cyber-reports-news-analysis-llama2-3k
收藏Hugging Face2024-04-15 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Vanessasml/cyber-reports-news-analysis-llama2-3k
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含公开报告和新闻的混合数据,旨在用于网络风险模型训练。数据集通过GPT4进行整理,包含一列串联的系统提示、指令、输入和GPT输出的数据。数据来源包括Casie项目和ENISA网站的新闻,以及多份网络安全报告。数据集特别关注网络威胁的识别和NIST分类法下的文本分类。数据集整理时考虑了LLama提示格式,建议在使用其他模型时注意这一点。
该数据集包含公开报告和新闻的混合数据,旨在用于网络风险模型训练。数据集通过GPT4进行整理,包含一列串联的系统提示、指令、输入和GPT输出的数据。数据来源包括Casie项目和ENISA网站的新闻,以及多份网络安全报告。数据集特别关注网络威胁的识别和NIST分类法下的文本分类。数据集整理时考虑了LLama提示格式,建议在使用其他模型时注意这一点。
提供机构:
Vanessasml
原始信息汇总
数据集卡片
该数据集包含公共报告和新闻的混合内容,旨在用于网络风险模型训练。数据集的生成格式参考了这篇文章。数据集的问答主要集中在网络威胁的识别和NIST分类法以及ITC EBA网络风险类别下的文本分类。
数据集详情
数据集描述
该数据集通过使用GPT4的数据整理流程进行整理。它包含一个列的Series,该列连接了系统提示、指令、输入和输出。后者是GPT的输出。
- 整理者: [Vanessa Lopes]
- 语言: [EN]
数据集来源
新闻来自Casie: CyberAttack Sensing and Information Extraction。
其他使用的新闻是从ENISA网站上网络爬取并上传到这里。
使用的报告包括:
- Cisco 2021 Cybersecurity Threat Trends Report.pdf,
- FS-ISAC 2022 Navigating Cyber Report.pdf,
- FS-ISAC 2023 Evolution of DDoS Report.pdf,
- FS-ISAC 2023 PreparingForAPostQuantumWorldByManagingCryptographicRisk.pdf,
- Google 2023 Threat Horizons Report.pdf,
- IBM Security 2023 X-Force Threat Intelligence Index.pdf,
- Imperva 2022 API Threat Report.pdf,
- Mandiant 2023 Global Perspectives on Threat Intelligence Report.pdf,
- Mandiant 2023 M-Trends Report.pdf,
- Microsoft 2022 Digital Defense Report Executive Summary.pdf,
- Microsoft 2022 Digital Defense Report.pdf,
- Palo Alto 2023 State of Cloud Native Security Report.pdf,
- TrendMicro 2023 Annual Cybersecurity Report.pdf,
- Verizon 2022 Data Breach Investigation Report.pdf,
- World Economic Forum 2023 Global Cybersecurity Report.pdf,
- ABN_AMRO_____Integrated_Annual_Report_2021.pdf,
- IT-Security-Situation-in-Germany-2020.pdf,
- IT-Security-Situation-in-Germany-2021.pdf,
- IT-Security-Situation-in-Germany-2022.pdf
数据收集和处理
该数据集的清洗和处理过程可以在该笔记本中找到。
建议
该数据集是为了适应LLamma提示格式而整理的。如果您打算将其用于其他模型,请考虑这一点。
致谢
感谢Casie项目与社区分享1000篇新闻文章。



