community-benign-samples
收藏数据集概述
基本信息
- 数据集名称: Community Benign Samples
- 发布者: Grupo de Robótica de la Universidad de León
- 发布日期: 2026年
- 许可证: Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
- 语言: 英语
- 标签: benign, cape, analysis
- 规模类别: 1<n<100
项目背景
本数据集是“ULE-CIBERLAB项目:面向国家商业结构的网络安全知识转移”的一部分。该项目由欧盟NextGeneration-EU、复苏与韧性计划通过INCIBE资助。
数据集描述
本数据集汇集了从Ciberlab Web社区上传中提取的**.exe样本**。每个样本包含以下内容:
- 原始二进制文件(
.exe) - 由CAPEv2生成的
report.json报告 - 由CAPEv2生成的
report.html报告(HTML版本) - CAPE在分析过程中捕获的屏幕截图
- 动态执行过程中丢弃的文件(如果有)
数据来源与归属
本存储库中所有样本均来自社区提交。用户可通过Ciberlab Web上传样本表单自由提交并分析自己的样本。
数据集结构
根目录结构如下:
dataset/ ├── JSON/ │ └── <md5>.json ├── HTML/ │ └── <md5>.html ├── screenshots/ │ └── <md5>/ │ └── md5.zip ├── binaries/ │ └── <md5>/ | ├── <md5>.exe │ └── LICENSE.MD └── dropped_files/ └── <md5>/ └── md5.zip
文件描述与格式
binaries/<md5>/<md5>.exe: 原始可执行文件的副本。JSON/<md5>.json: CAPEv2分析的JSON输出,包含元数据、进程、丢弃文件、网络活动、签名等信息。HTML/<md5>.html: CAPEv2生成的HTML版本报告。screenshots/<md5>/*.png: 动态执行过程中捕获的屏幕截图。dropped_files/<md5>/*: 恶意软件在沙箱执行期间留在磁盘上的文件。
CAPEv2沙箱配置
为分析具有规避能力的样本,对生成此数据集时使用的CAPEv2沙箱配置进行了调整。为支持实验复现,存储库中包含了所使用的配置文件(CAPEv2 conf/文件夹)和自定义KVM虚拟机XML。
配置结构如下:
CAPEv2 Configuration/ ├── XML KVM/ │ └── xml-custom-machine.xml └── conf/ └── ...
XML KVM/: 包含虚拟机的XML描述符(建议名称:xml-custom-machine.xml),反映了分析中使用的VM配置(vCPU、内存、虚拟设备、磁盘、模拟NIC等)。conf/: 实验中CAPEv2使用的conf文件夹副本,包含相关配置文件(路径、超时设置、启用模块、与分析后端集成、网络捕获参数等)。注意:所有敏感数据(凭据、私钥)已被移除。
引用方式
Bayón-Martínez, R., & Prieto-González, A. (2026). Community Benign Samples Dataset [Data set]. Grupo de Robótica de la Universidad de León. Hugging Face.
https://huggingface.co/datasets/unileon-robotics/community-benign-samples
许可证: Creative Commons BY-NC-SA 4.0.
BibTeX引用格式: bibtex @dataset{bayonmartinez_prietogonzalez_2026_community_benign_samples, author = {Bayón-Martínez, Raúl and Prieto-González, Adrian}, title = {Community Benign Samples Dataset}, year = {2026}, publisher = {Grupo de Robótica de la Universidad de León}, howpublished = {url{https://huggingface.co/datasets/unileon-robotics/community-benign-samples}}, note = {Available on Hugging Face. License: CC BY-NC-SA 4.0} }
联系人
- Raúl Bayón Martínez: 莱昂大学博士研究生/研究职员。邮箱:rbaym@unileon.es
- Adrián Prieto González: 莱昂大学研究职员。邮箱:aprig@unileon.es




