EMBER
收藏OpenDataLab2026-03-29 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/EMBER
下载链接
链接失效反馈资源简介:
用于训练机器学习模型以静态检测恶意 Windows 可移植可执行文件的标记基准数据集。该数据集包括从 1.1M 二进制文件中提取的特征:900K 训练样本(300K 恶意,300K 良性,300K 未标记)和 200K 测试样本(100K 恶意,100K 良性)。
A labeled benchmark dataset for training machine learning models to statically detect malicious Windows Portable Executable (PE) files. This dataset includes features extracted from 1.1M binary files: 900K training samples (300K malicious, 300K benign, 300K unlabeled) and 200K test samples (100K malicious, 100K benign).
提供机构:
OpenDataLab
创建时间:
2022-05-23
AI搜集汇总
数据集介绍

背景与挑战
背景概述
EMBER是一个用于静态检测恶意Windows可移植可执行文件的机器学习基准数据集,包含从110万个二进制文件中提取的特征,其中训练集有90万样本(包括恶意、良性和未标记数据),测试集有20万样本(恶意和良性各半)。该数据集由Endgame, Inc.于2018年发布,支持特征工程和恶意软件分类任务,采用MIT许可证,旨在促进恶意软件检测模型的研究与开发。
以上内容由AI搜集并总结生成



