SoLID/shellcode_i_a32
收藏Hugging Face2022-11-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/SoLID/shellcode_i_a32
下载链接
链接失效反馈官方服务:
资源简介:
Shellcode_IA32数据集包含了20年来从多种来源收集的shellcode,是目前最大的汇编语言shellcode集合。该数据集包含3200个IA-32架构(x86 Intel Architecture的32位版本)的汇编指令示例,主要来源于公开的安全漏洞利用,如exploit-db和shell-storm。此外,数据集还包括从教程和书籍中收集的汇编程序示例,以理解不同作者和汇编专家如何注释代码,并处理自然语言的歧义。数据集中10%的指令来自书籍和指南,其余来自真实的shellcode。数据集的主要用途是用于自动生成shellcode的研究,特别是在自然语言处理与编程结合的领域。
提供机构:
SoLID
原始信息汇总
Shellcode_IA32 数据集概述
数据集基本信息
- 名称: Shellcode_IA32
- 描述: 包含20年来的shellcode数据,是目前最大的汇编语言shellcode集合。
- 语言: 代码(汇编语言)、英语
- 许可证: GPL-3.0
- 多语言性: 翻译
- 大小类别: 未知
- 来源: 原始数据
- 任务类别: 文本生成
- 任务ID: 语言建模
- Paperswithcode ID: shellcode-ia32
数据集内容
- 组成: 包含3,200个IA-32架构的汇编语言指令示例,来源于公开的安全漏洞利用。
- 数据来源: 收集自exploit-db和shell-storm。
- 数据增强: 通过添加来自流行教程和书籍的汇编程序示例,以理解不同作者和汇编专家的注释方式。
- 数据结构: 每行数据代表一个“代码片段-意图”对,其中“代码片段”是遵循NASM语法的汇编代码行或组合,“意图”是英语注释。
应用场景
- 重点: 专注于Linux操作系统,最常用的安全关键网络服务操作系统。
- 工具: 使用Netwide Assembler (NASM) 编写的Linux汇编指令。
相关研究
- 研究论文: Shellcode_IA32: A Dataset for Automatic Shellcode Generation,描述了数据集的进一步统计信息和使用神经机器翻译模型的初步实验。



