SOREL-20M
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/sophos-ai/sorel-20m
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了大约2000万个Windows可移植可执行(PE)文件的元数据和特征,其中包括1000万个已解除武装的恶意软件样本。其任务是对Windows PE文件进行分析。
This dataset contains metadata and features of approximately 20 million Windows Portable Executable (PE) files, with 10 million of them being disarmed malware samples. It is designed for the analysis of Windows PE files.
提供机构:
SOREL project
搜集汇总
数据集介绍

背景与挑战
背景概述
SOREL-20M是一个包含2000万个恶意PE文件样本的大规模数据集,用于恶意软件检测研究。数据集提供了8TB的压缩恶意软件二进制文件、处理后的元数据和特征数据,以及基线模型,支持深度学习(如FFNN)和LightGBM等算法的训练和评估。
以上内容由遇见数据集搜集并总结生成



