five

SOREL-20M

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/sophos-ai/sorel-20m
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了大约2000万个Windows可移植可执行(PE)文件的元数据和特征,其中包括1000万个已解除武装的恶意软件样本。其任务是对Windows PE文件进行分析。

This dataset contains metadata and features of approximately 20 million Windows Portable Executable (PE) files, with 10 million of them being disarmed malware samples. It is designed for the analysis of Windows PE files.
提供机构:
SOREL project
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
SOREL-20M是一个包含2000万个恶意PE文件样本的大规模数据集,用于恶意软件检测研究。数据集提供了8TB的压缩恶意软件二进制文件、处理后的元数据和特征数据,以及基线模型,支持深度学习(如FFNN)和LightGBM等算法的训练和评估。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作