ransomwaredataset2016
收藏github2021-12-29 更新2024-05-31 收录
下载链接:
https://github.com/rissgrouphub/ransomwaredataset2016
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含582个勒索软件样本和942个良性应用程序(良性软件)的动态分析,总计1524个样本。数据集于2016年2月底使用Cuckoo Sandbox获取并分析。更多关于数据集的详细信息可在相关论文中找到。
This dataset comprises dynamic analyses of 582 ransomware samples and 942 benign applications (benign software), totaling 1,524 samples. The data was acquired and analyzed using Cuckoo Sandbox at the end of February 2016. Further details regarding the dataset can be found in the associated research paper.
创建时间:
2021-12-29
原始信息汇总
数据集概述
数据集内容
- 样本总数:1524个样本
- 分类:包含582个勒索软件样本和942个良性应用程序(良性软件)样本
数据集分析
- 分析工具:Cuckoo Sandbox
- 分析时间:2016年2月底
勒索软件家族
- 家族名称及代码:
- Goodware: 0
- Critroni: 1
- CryptLocker: 2
- CryptoWall: 3
- KOLLAH: 4
- Kovter: 5
- Locker: 6
- MATSNU: 7
- PGPCODER: 8
- Reveton: 9
- TeslaCrypt: 10
- Trojan-Ransom: 11
特征集
- 特征集代码及描述:
- API: API调用
- DROP: 丢弃文件的扩展名
- REG: 注册表键操作
- FILES: 文件操作
- FILES_EXT: 涉及文件操作的文件扩展名
- DIR: 文件目录操作
- STR: 嵌入字符串
软件分析标识
- 文件:IDS.txt
- 内容:包含本地标识符、SHA1和MD5哈希标识符、软件类型(勒索软件/良性软件)及勒索软件家族的数字标识符。
搜集汇总
数据集介绍

构建方式
ransomwaredataset2016数据集通过Cuckoo Sandbox工具对582个勒索软件样本和942个良性应用程序样本进行了动态分析,共计1524个样本。数据采集与分析工作于2016年2月底完成,确保了数据的时效性与准确性。该数据集的构建旨在为勒索软件的自动化动态分析提供支持,涵盖了多种勒索软件家族及其行为特征。
特点
该数据集的特点在于其全面性与多样性,涵盖了12个不同的勒索软件家族,包括Critroni、CryptLocker、CryptoWall等。每个样本的行为特征通过API调用、文件操作、注册表操作等多个维度进行记录,提供了丰富的分析视角。此外,数据集还包含了良性应用程序的样本,为对比研究提供了基础。
使用方法
使用ransomwaredataset2016数据集时,研究人员可通过IDS.txt文件中的本地ID、SHA1和MD5标识符快速定位样本。数据集中的特征集(如API调用、文件操作等)可用于构建机器学习模型,以检测和分类勒索软件。引用数据集时,需参考相关论文,以确保学术规范性与数据来源的透明性。
背景与挑战
背景概述
ransomwaredataset2016数据集由Daniele Sgandurra等研究人员于2016年2月创建,旨在通过动态分析技术深入研究勒索软件的行为特征。该数据集包含582个勒索软件样本和942个良性应用程序样本,总计1524个样本,涵盖了多个勒索软件家族,如CryptLocker、CryptoWall等。研究人员利用Cuckoo Sandbox进行数据采集与分析,相关研究成果发表于arXiv预印本平台。该数据集为勒索软件的自动化检测与分析提供了重要的数据支持,推动了网络安全领域的研究进展。
当前挑战
ransomwaredataset2016数据集在构建与应用过程中面临多重挑战。首先,勒索软件行为复杂且多变,如何准确捕捉其动态特征并区分其与良性软件的行为差异,是数据集解决的核心问题。其次,数据采集过程中需确保样本的多样性与代表性,以覆盖不同勒索软件家族的行为模式。此外,动态分析技术的局限性可能导致部分行为特征未被完全捕获,影响数据集的全面性与准确性。这些挑战为勒索软件检测技术的进一步发展提出了更高的要求。
常用场景
经典使用场景
在网络安全领域,ransomwaredataset2016数据集被广泛应用于恶意软件行为分析的研究中。该数据集通过Cuckoo Sandbox对582个勒索软件样本和942个正常应用程序样本进行了动态分析,涵盖了API调用、文件操作、注册表操作等多个特征集。研究人员利用这些数据,能够深入理解勒索软件的行为模式,从而开发出更有效的检测和防御机制。
解决学术问题
ransomwaredataset2016数据集为学术界提供了丰富的实验数据,解决了勒索软件检测中的多个关键问题。通过对不同勒索软件家族的行为特征进行系统分析,研究人员能够识别出勒索软件的共性行为,进而提出基于行为特征的检测方法。该数据集的使用,显著提升了勒索软件检测的准确性和效率,为网络安全领域的研究提供了重要支持。
衍生相关工作
ransomwaredataset2016数据集催生了多项经典研究工作,特别是在勒索软件检测和行为分析领域。基于该数据集,研究人员提出了多种基于机器学习的检测算法,如支持向量机、随机森林等。此外,该数据集还被用于开发新型的勒索软件防御策略,如行为阻断和动态分析技术,为网络安全领域的技术创新提供了重要参考。
以上内容由遇见数据集搜集并总结生成



