Android-Application-Dataset-for-Malware-Detection
收藏github2023-10-30 更新2024-05-31 收录
下载链接:
https://github.com/cskamil/Android-Application-Dataset-for-Malware-Detection
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含2014年6月从Google Play下载的17,231个Android应用程序的权限和其他相关元数据。此外,还包括了这些应用程序在VirusTotal社区的分析结果。数据集中的某些Google Play相关特征,即连续属性,已为运行朴素贝叶斯算法进行了预处理。
This dataset comprises permissions and other relevant metadata of 17,231 Android applications downloaded from Google Play in June 2014. Additionally, it includes the analysis results of these applications from the VirusTotal community. Certain Google Play-related features within the dataset, specifically continuous attributes, have been preprocessed for the execution of the Naive Bayes algorithm.
创建时间:
2016-08-15
原始信息汇总
数据集概述
数据集名称
Android-Application-Dataset-for-Malware-Detection
数据集内容
- 数据类型:Excel文件
- 数据量:包含17,231条Android权限和Google Play相关元数据
- 数据来源:2014年6月从Google Play下载的应用程序
- 附加信息:包括VirusTotal分析结果,部分Google Play相关特征已预处理以适应Naive Bayes算法
数据集用途
用于移动恶意软件检测的分类算法比较研究
引用信息
- 作者:N.Baltaci
- 论文:"A Comparison of Classification Algorithms for Mobile Malware Detection: Market Metadata as Input Source"
- 学位:硕士论文
- 机构:Middle East Technical University, Turkey, 2014
搜集汇总
数据集介绍

构建方式
该数据集构建于2014年6月,涵盖了从Google Play下载的17,231个Android应用程序的权限信息及其他相关元数据。数据收集过程中,研究人员不仅提取了应用程序的权限信息,还通过VirusTotal平台获取了这些应用程序的恶意软件分析结果。为了适应朴素贝叶斯算法的运行需求,部分Google Play相关的连续属性数据进行了预处理。详细的收集与预处理方法可参考相关研究论文。
特点
该数据集的核心特点在于其丰富的元数据信息,涵盖了Android应用程序的权限请求、Google Play市场相关属性以及VirusTotal的恶意软件检测结果。这些数据为研究移动恶意软件检测提供了多维度的输入源。此外,数据集中的连续属性经过预处理,使其更适合机器学习算法的应用,尤其是朴素贝叶斯分类器的训练与评估。
使用方法
该数据集适用于移动恶意软件检测领域的研究,特别是基于市场元数据的分类算法比较研究。用户可通过分析应用程序的权限信息和恶意软件检测结果,构建机器学习模型以识别潜在的恶意软件。使用该数据集时,需引用相关研究论文,以确保学术规范的遵循。数据集以Excel文件形式提供,便于用户直接加载并进行数据分析。
背景与挑战
背景概述
Android-Application-Dataset-for-Malware-Detection数据集由中东技术大学的N. Baltaci于2014年创建,旨在通过分析Google Play商店中的应用程序权限和元数据,提升移动恶意软件检测的准确性。该数据集包含了2014年6月从Google Play下载的17,231个Android应用程序的权限信息及其他相关元数据,并结合了VirusTotal的恶意软件分析结果。该研究通过比较不同分类算法在移动恶意软件检测中的表现,探索了市场元数据作为输入源的有效性。这一数据集为移动安全领域的研究提供了重要的数据支持,推动了基于机器学习的恶意软件检测技术的发展。
当前挑战
Android-Application-Dataset-for-Malware-Detection数据集在构建和应用过程中面临多重挑战。首先,移动恶意软件检测领域本身具有高度动态性,恶意软件的变种和新型攻击手段层出不穷,这要求数据集能够及时更新以反映最新的威胁态势。其次,数据收集过程中涉及大量应用程序的权限和元数据,如何确保数据的完整性和准确性是一个关键问题。此外,数据预处理阶段需要对连续属性进行转换以适应朴素贝叶斯等算法的需求,这一过程可能引入偏差或信息丢失。最后,尽管VirusTotal提供了恶意软件分析结果,但其检测结果可能存在误报或漏报,这为数据集的可靠性带来了潜在挑战。
常用场景
经典使用场景
Android-Application-Dataset-for-Malware-Detection数据集在恶意软件检测领域具有广泛的应用。该数据集包含了从Google Play下载的17,231个Android应用程序的权限信息及其他相关元数据,结合VirusTotal的分析结果,为研究人员提供了一个丰富的实验平台。通过该数据集,研究者可以深入分析Android应用程序的权限使用模式,识别潜在的恶意行为,并开发高效的恶意软件检测算法。
衍生相关工作
基于该数据集,研究者们开展了多项经典工作。例如,N.Baltaci在其硕士论文中比较了多种分类算法在移动恶意软件检测中的性能,为后续研究提供了重要参考。此外,该数据集还激发了更多关于Android应用程序权限滥用和恶意行为检测的研究,推动了移动安全领域的技术进步和理论发展。
数据集最近研究
最新研究方向
近年来,随着移动设备的普及和Android操作系统的广泛应用,恶意软件检测成为网络安全领域的重要研究方向。Android-Application-Dataset-for-Malware-Detection数据集为研究者提供了丰富的Android应用权限和Google Play元数据,结合VirusTotal的分析结果,为恶意软件检测算法的开发与优化提供了宝贵资源。当前研究热点集中在利用机器学习算法,如朴素贝叶斯、深度学习模型等,对恶意软件进行高效分类与检测。该数据集的应用不仅推动了恶意软件检测技术的进步,还为移动应用市场的安全评估提供了科学依据,具有重要的学术价值和实际意义。
以上内容由遇见数据集搜集并总结生成



