five

SoLID/shellcode_i_a32

收藏
Hugging Face2022-11-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/SoLID/shellcode_i_a32
下载链接
链接失效反馈
官方服务:
资源简介:
Shellcode_IA32数据集包含了20年来从多种来源收集的shellcode,是目前最大的汇编语言shellcode集合。该数据集包含3200个IA-32架构(x86 Intel Architecture的32位版本)的汇编指令示例,主要来源于公开的安全漏洞利用,如exploit-db和shell-storm。此外,数据集还包括从教程和书籍中收集的汇编程序示例,以理解不同作者和汇编专家如何注释代码,并处理自然语言的歧义。数据集中10%的指令来自书籍和指南,其余来自真实的shellcode。数据集的主要用途是用于自动生成shellcode的研究,特别是在自然语言处理与编程结合的领域。
提供机构:
SoLID
原始信息汇总

Shellcode_IA32 数据集概述

数据集基本信息

  • 名称: Shellcode_IA32
  • 描述: 包含20年来的shellcode数据,是目前最大的汇编语言shellcode集合。
  • 语言: 代码(汇编语言)、英语
  • 许可证: GPL-3.0
  • 多语言性: 翻译
  • 大小类别: 未知
  • 来源: 原始数据
  • 任务类别: 文本生成
  • 任务ID: 语言建模
  • Paperswithcode ID: shellcode-ia32

数据集内容

  • 组成: 包含3,200个IA-32架构的汇编语言指令示例,来源于公开的安全漏洞利用。
  • 数据来源: 收集自exploit-dbshell-storm
  • 数据增强: 通过添加来自流行教程和书籍的汇编程序示例,以理解不同作者和汇编专家的注释方式。
  • 数据结构: 每行数据代表一个“代码片段-意图”对,其中“代码片段”是遵循NASM语法的汇编代码行或组合,“意图”是英语注释。

应用场景

  • 重点: 专注于Linux操作系统,最常用的安全关键网络服务操作系统。
  • 工具: 使用Netwide Assembler (NASM) 编写的Linux汇编指令。

相关研究

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作