five

Vanessasml/cyber-reports-news-analysis-llama2-3k

收藏
Hugging Face2024-04-15 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Vanessasml/cyber-reports-news-analysis-llama2-3k
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含公开报告和新闻的混合数据,旨在用于网络风险模型训练。数据集通过GPT4进行整理,包含一列串联的系统提示、指令、输入和GPT输出的数据。数据来源包括Casie项目和ENISA网站的新闻,以及多份网络安全报告。数据集特别关注网络威胁的识别和NIST分类法下的文本分类。数据集整理时考虑了LLama提示格式,建议在使用其他模型时注意这一点。

该数据集包含公开报告和新闻的混合数据,旨在用于网络风险模型训练。数据集通过GPT4进行整理,包含一列串联的系统提示、指令、输入和GPT输出的数据。数据来源包括Casie项目和ENISA网站的新闻,以及多份网络安全报告。数据集特别关注网络威胁的识别和NIST分类法下的文本分类。数据集整理时考虑了LLama提示格式,建议在使用其他模型时注意这一点。
提供机构:
Vanessasml
原始信息汇总

数据集卡片

该数据集包含公共报告和新闻的混合内容,旨在用于网络风险模型训练。数据集的生成格式参考了这篇文章。数据集的问答主要集中在网络威胁的识别和NIST分类法以及ITC EBA网络风险类别下的文本分类。

数据集详情

数据集描述

该数据集通过使用GPT4的数据整理流程进行整理。它包含一个列的Series,该列连接了系统提示、指令、输入和输出。后者是GPT的输出。

  • 整理者: [Vanessa Lopes]
  • 语言: [EN]

数据集来源

新闻来自Casie: CyberAttack Sensing and Information Extraction

其他使用的新闻是从ENISA网站上网络爬取并上传到这里

使用的报告包括:

  • Cisco 2021 Cybersecurity Threat Trends Report.pdf,
  • FS-ISAC 2022 Navigating Cyber Report.pdf,
  • FS-ISAC 2023 Evolution of DDoS Report.pdf,
  • FS-ISAC 2023 PreparingForAPostQuantumWorldByManagingCryptographicRisk.pdf,
  • Google 2023 Threat Horizons Report.pdf,
  • IBM Security 2023 X-Force Threat Intelligence Index.pdf,
  • Imperva 2022 API Threat Report.pdf,
  • Mandiant 2023 Global Perspectives on Threat Intelligence Report.pdf,
  • Mandiant 2023 M-Trends Report.pdf,
  • Microsoft 2022 Digital Defense Report Executive Summary.pdf,
  • Microsoft 2022 Digital Defense Report.pdf,
  • Palo Alto 2023 State of Cloud Native Security Report.pdf,
  • TrendMicro 2023 Annual Cybersecurity Report.pdf,
  • Verizon 2022 Data Breach Investigation Report.pdf,
  • World Economic Forum 2023 Global Cybersecurity Report.pdf,
  • ABN_AMRO_____Integrated_Annual_Report_2021.pdf,
  • IT-Security-Situation-in-Germany-2020.pdf,
  • IT-Security-Situation-in-Germany-2021.pdf,
  • IT-Security-Situation-in-Germany-2022.pdf

数据收集和处理

该数据集的清洗和处理过程可以在该笔记本中找到。

建议

该数据集是为了适应LLamma提示格式而整理的。如果您打算将其用于其他模型,请考虑这一点。

致谢

感谢Casie项目与社区分享1000篇新闻文章。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作