Vanessasml/cybersecurity_32k_instruction_input_output
收藏Hugging Face2024-04-19 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/Vanessasml/cybersecurity_32k_instruction_input_output
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包括公开报告和新闻的混合内容,旨在用于网络安全风险模型的训练。它包含32k个示例,每个示例包括指令、输入和输出。输出由GPT生成。数据集经过清理和处理,适合用于LLamma提示格式。
该数据集包括公开报告和新闻的混合内容,旨在用于网络安全风险模型的训练。它包含32k个示例,每个示例包括指令、输入和输出。输出由GPT生成。数据集经过清理和处理,适合用于LLamma提示格式。
提供机构:
Vanessasml
原始信息汇总
数据集概述
数据集描述
该数据集包含公共报告和新闻,旨在用于网络安全风险模型训练。数据集包含32,000个示例,每个示例包括指令、输入和输出。输出由GPT生成。
- 制作人: Vanessa Lopes
- 语言: 英语
数据集来源
ds=1行包含由人工整理的IT风险公共报告。ds=2行包含由GPT4整理的公共报告和新闻,重点关注与EBA指南相关的网络安全风险问题。ds=3行包含由GPT4整理的公共报告和新闻,重点关注与NIST分类法相关的问题。ds=4行包含来自Casie: CyberAttack Sensing and Information Extraction数据集的新闻,重点关注网络安全威胁的识别。
其他新闻数据集是从ENISA网站上抓取并上传的。
使用的报告数据集包括:
- Cisco 2021 Cybersecurity Threat Trends Report.pdf
- FS-ISAC 2022 Navigating Cyber Report.pdf
- FS-ISAC 2023 Evolution of DDoS Report.pdf
- FS-ISAC 2023 PreparingForAPostQuantumWorldByManagingCryptographicRisk.pdf
- Google 2023 Threat Horizons Report.pdf
- IBM Security 2023 X-Force Threat Intelligence Index.pdf
- Imperva 2022 API Threat Report.pdf
- Mandiant 2023 Global Perspectives on Threat Intelligence Report.pdf
- Mandiant 2023 M-Trends Report.pdf
- Microsoft 2022 Digital Defense Report Executive Summary.pdf
- Microsoft 2022 Digital Defense Report.pdf
- Palo Alto 2023 State of Cloud Native Security Report.pdf
- TrendMicro 2023 Annual Cybersecurity Report.pdf
- Verizon 2022 Data Breach Investigation Report.pdf
- World Economic Forum 2023 Global Cybersecurity Report.pdf
- ABN_AMRO_____Integrated_Annual_Report_2021.pdf
- IT-Security-Situation-in-Germany-2020.pdf
- IT-Security-Situation-in-Germany-2021.pdf
- IT-Security-Situation-in-Germany-2022.pdf
数据收集和处理
数据集的清洗和处理过程可在相关笔记本中找到。
推荐
该数据集是为适应LLamma提示格式而整理的。如果您打算将其用于其他模型,请考虑这一点。
致谢
感谢Casie项目与社区分享1,000篇新闻文章。



