Dataset-Fyp-

github2018-12-05 更新2024-05-31 收录

下载链接：

https://github.com/shabnamrani31/Dataset-Fyp-

下载链接

链接失效反馈

官方服务：

资源简介：

我们的数据集包含恶意和良性文件。为了验证概念，我们使用了1000个文件，其中500个是恶意文件，500个是良性文件。最新的.csv文件包含了贡献于我们良性APK数据集的良性APK。您只需要一个脚本，该脚本可以根据相应的文件名下载恶意APK。我们从Google Play商店逐个下载了500个良性APK，并对恶意和良性APK运行转换脚本，将每个文件转换为二进制文件，然后进一步转换为图像。CNN模型随后在这些图像上进行训练，以读取行为。在每个卷积层上改变权重有助于更好地理解行为。

Our dataset comprises both malicious and benign files. To validate the concept, we utilized 1,000 files, with 500 being malicious and 500 benign. The latest .csv file includes benign APKs that have contributed to our benign APK dataset. A single script is all that is required to download malicious APKs based on their corresponding filenames. We downloaded 500 benign APKs one by one from the Google Play Store and executed a conversion script on both malicious and benign APKs to transform each file into a binary format, which was then further converted into images. A CNN model was subsequently trained on these images to interpret behaviors. Adjusting weights at each convolutional layer aids in a more nuanced understanding of these behaviors.

创建时间：

2018-06-04

原始信息汇总

数据集概述

数据集组成

包含恶意文件和良性文件。
示例数据集包含1000个文件，其中500个恶意文件和500个良性文件。

数据来源

良性APK文件从Google Play商店逐一下载，数量为500个。
恶意APK文件需通过脚本下载，数量为500个。

数据处理

通过转换脚本将APK文件转换为二进制格式。
进一步将二进制文件转换为图像格式。

模型训练

使用卷积神经网络（CNN）模型对图像进行训练，以分析文件行为。
通过调整卷积层的权重来优化行为分析的准确性。

搜集汇总

数据集介绍

构建方式

Dataset-Fyp-数据集的构建采取了对恶意文件与良性文件进行分类的思路。具体而言，该数据集包含1000个文件，其中500个为恶意文件，另外500个为良性文件。良性APK文件是从GOOGLE Play商店逐一下载而得，而恶意APK文件的获取则需要通过一个脚本，根据相应的文件名进行下载。通过执行转换脚本，将良性及恶意APK文件转换成二进制文件，进而将二进制文件转化为图像格式，以供后续的模型训练使用。

使用方法

使用Dataset-Fyp-数据集时，用户需要首先获取相应的脚本以完成恶意APK文件的下载。良性APK文件已存在于数据集中，无需额外操作。在获取完整的数据集后，用户可执行转换脚本，将APK文件转换为可用于训练的图像格式。随后，用户可基于这些图像数据训练CNN模型，以分析和理解APK的行为特征。

背景与挑战

背景概述

Dataset-Fyp-是一个包含恶意与良性文件的数据集，旨在为恶意软件检测领域提供研究资源。该数据集的构建起始于对移动应用APK文件的行为分析需求，以期为移动安全领域提供有力的数据支持。其创建的具体时间虽不明确，但由此可见，该数据集的构建者对移动应用安全性问题有着深入的研究。数据集包含了1000个文件，其中恶意与良性文件各占一半。良性APK文件直接从谷歌应用商店下载，而恶意APK文件则需通过特定脚本下载。研究人员利用卷积神经网络（CNN）模型对转换成图像的APK文件进行训练，以识别和预测其行为模式。该数据集对移动应用安全、恶意软件检测等领域具有重要的研究价值。

当前挑战

数据集构建过程中面临的主要挑战包括：确保数据集的多样性和代表性，以涵盖广泛的恶意软件变体；保证良性文件的纯净性，避免误将恶意文件混入其中；以及APK文件向图像转换过程中的信息损失最小化。在研究领域问题方面，该数据集所解决的挑战包括但不限于提升移动应用恶意行为检测的准确性，以及对抗恶意软件开发者不断变化的攻击策略。此外，构建有效的CNN模型以准确读取APK行为，并在卷积层中对权重进行调整以深化行为理解，也是当前研究的重要挑战。

常用场景

经典使用场景

在深入探索移动应用安全性的研究领域，Dataset-Fyp-数据集以其精确区分恶意与良性APK文件的能力，成为学术研究的经典工具。该数据集通常被用于构建并训练卷积神经网络模型，通过对APK文件的二进制转换以及图像化处理，研究者能够从中提取出深层次的行为特征，进而实现对恶意软件的有效识别。

解决学术问题

Dataset-Fyp-数据集解决了移动应用安全领域中对恶意软件检测效率低下的问题。通过提供均衡的良性及恶意APK样本，该数据集使得研究者能够训练出具有较高准确率的分类模型，这对于提升移动设备的安全防护水平具有重大的学术意义和实际影响。

实际应用

在现实世界中，Dataset-Fyp-数据集的应用场景广泛，它不仅被用于移动安全领域的教育与研究中，也被网络安全公司采用，以增强其安全检测系统的效能，保护用户的移动设备免受恶意软件的侵害。

数据集最近研究