five

Vanessasml/cybersecurity_32k_instruction_input_output

收藏
Hugging Face2024-04-19 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/Vanessasml/cybersecurity_32k_instruction_input_output
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包括公开报告和新闻的混合内容,旨在用于网络安全风险模型的训练。它包含32k个示例,每个示例包括指令、输入和输出。输出由GPT生成。数据集经过清理和处理,适合用于LLamma提示格式。

该数据集包括公开报告和新闻的混合内容,旨在用于网络安全风险模型的训练。它包含32k个示例,每个示例包括指令、输入和输出。输出由GPT生成。数据集经过清理和处理,适合用于LLamma提示格式。
提供机构:
Vanessasml
原始信息汇总

数据集概述

数据集描述

该数据集包含公共报告和新闻,旨在用于网络安全风险模型训练。数据集包含32,000个示例,每个示例包括指令、输入和输出。输出由GPT生成。

  • 制作人: Vanessa Lopes
  • 语言: 英语

数据集来源

  • ds=1 行包含由人工整理的IT风险公共报告。
  • ds=2 行包含由GPT4整理的公共报告和新闻,重点关注与EBA指南相关的网络安全风险问题。
  • ds=3 行包含由GPT4整理的公共报告和新闻,重点关注与NIST分类法相关的问题。
  • ds=4 行包含来自Casie: CyberAttack Sensing and Information Extraction数据集的新闻,重点关注网络安全威胁的识别。

其他新闻数据集是从ENISA网站上抓取并上传的。

使用的报告数据集包括:

  • Cisco 2021 Cybersecurity Threat Trends Report.pdf
  • FS-ISAC 2022 Navigating Cyber Report.pdf
  • FS-ISAC 2023 Evolution of DDoS Report.pdf
  • FS-ISAC 2023 PreparingForAPostQuantumWorldByManagingCryptographicRisk.pdf
  • Google 2023 Threat Horizons Report.pdf
  • IBM Security 2023 X-Force Threat Intelligence Index.pdf
  • Imperva 2022 API Threat Report.pdf
  • Mandiant 2023 Global Perspectives on Threat Intelligence Report.pdf
  • Mandiant 2023 M-Trends Report.pdf
  • Microsoft 2022 Digital Defense Report Executive Summary.pdf
  • Microsoft 2022 Digital Defense Report.pdf
  • Palo Alto 2023 State of Cloud Native Security Report.pdf
  • TrendMicro 2023 Annual Cybersecurity Report.pdf
  • Verizon 2022 Data Breach Investigation Report.pdf
  • World Economic Forum 2023 Global Cybersecurity Report.pdf
  • ABN_AMRO_____Integrated_Annual_Report_2021.pdf
  • IT-Security-Situation-in-Germany-2020.pdf
  • IT-Security-Situation-in-Germany-2021.pdf
  • IT-Security-Situation-in-Germany-2022.pdf

数据收集和处理

数据集的清洗和处理过程可在相关笔记本中找到。

推荐

该数据集是为适应LLamma提示格式而整理的。如果您打算将其用于其他模型,请考虑这一点。

致谢

感谢Casie项目与社区分享1,000篇新闻文章。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作