five

Android-Application-Dataset-for-Malware-Detection

收藏
github2020-05-29 更新2024-05-31 收录
下载链接:
https://github.com/rozer821/Android-Application-Dataset-for-Malware-Detection
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含从Google Play下载的Android应用程序,涵盖了17,231个Android权限和其他与Google Play相关的元数据。此外,还包括了数据收集日期时在VirusTotal上的应用程序分析结果。部分Google Play相关特征,即连续属性,已预处理以运行朴素贝叶斯算法。

This dataset comprises Android applications downloaded from Google Play, encompassing 17,231 Android permissions and other metadata related to Google Play. Additionally, it includes the analysis results of the applications on VirusTotal at the time of data collection. Certain Google Play-related features, specifically continuous attributes, have been preprocessed to facilitate the execution of the Naive Bayes algorithm.
创建时间:
2018-11-01
原始信息汇总

数据集概述

数据集名称

Android-Application-Dataset-for-Malware-Detection

数据集内容

  • 数据类型:Excel文件
  • 数据量:包含17,231条Android权限和其他与Google Play相关的元数据。
  • 数据来源:Google Play,收集于2014年6月。
  • 附加信息:包含应用在VirusTotal社区的分析结果。
  • 预处理:部分Google Play相关特征(连续属性)已预处理,以便运行Naive Bayes算法。

数据集引用

  • 引用文献:N. Baltaci, "A Comparison of Classification Algorithms for Mobile Malware Detection: Market Metadata as Input Source" M.S. thesis, Middle East Technical University, Turkey, 2014.
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集构建于2014年6月,涵盖了从Google Play下载的17,231个Android应用程序的权限信息及其他相关元数据。数据收集过程中,研究人员不仅提取了应用程序的权限信息,还通过VirusTotal平台获取了这些应用程序的恶意软件分析结果。为了适应朴素贝叶斯算法的运行,部分Google Play相关的连续属性数据进行了预处理。详细的收集与预处理方法可参考相关论文。
特点
该数据集的特点在于其全面性,不仅包含了Android应用程序的权限信息,还整合了VirusTotal的恶意软件检测结果,为恶意软件检测研究提供了丰富的输入源。此外,数据集中的元数据经过预处理,便于直接应用于机器学习算法的训练与测试,尤其是朴素贝叶斯分类器的应用。
使用方法
使用该数据集时,研究人员可通过分析权限信息与恶意软件检测结果,构建或优化恶意软件检测模型。数据集中的预处理数据可直接用于算法训练,而原始数据则可用于进一步的特征工程与模型验证。引用数据集时,需注明相关研究论文,以确保学术规范性。
背景与挑战
背景概述
Android-Application-Dataset-for-Malware-Detection数据集由中东技术大学的研究人员于2014年创建,主要贡献者为N. Baltaci。该数据集包含了从Google Play下载的17,231个Android应用程序的权限信息及其他相关元数据,旨在通过机器学习算法检测移动恶意软件。数据集的核心研究问题在于如何利用市场元数据作为输入源,有效区分正常应用与恶意软件。该数据集为移动安全领域的研究提供了重要的数据支持,推动了基于权限分析的恶意软件检测技术的发展。
当前挑战
该数据集面临的挑战主要体现在两个方面。首先,恶意软件检测领域本身具有高度复杂性,恶意软件不断演化,传统的基于签名的检测方法已难以应对新型威胁。其次,数据集的构建过程中,研究人员需处理大量异构数据,包括权限信息、应用元数据及VirusTotal的分析结果,数据预处理和特征提取的复杂性较高。此外,由于数据采集时间较早,部分应用可能已不再适用于当前环境,数据时效性问题也成为一大挑战。
常用场景
经典使用场景
在移动安全领域,Android-Application-Dataset-for-Malware-Detection数据集被广泛应用于恶意软件检测的研究中。研究者通过分析该数据集中的17,231个Android应用程序权限及其相关元数据,结合VirusTotal的分析结果,能够有效地识别和分类潜在的恶意软件。这一数据集为开发高效的恶意软件检测算法提供了坚实的基础。
解决学术问题
该数据集解决了移动设备恶意软件检测中的关键问题,特别是在如何利用市场元数据作为输入源进行有效分类方面。通过提供详细的权限信息和VirusTotal的分析结果,研究者能够开发出更为精确的分类算法,从而提升恶意软件检测的准确性和效率。这一数据集的出现填补了移动安全研究中的空白,推动了该领域的进一步发展。
衍生相关工作
基于Android-Application-Dataset-for-Malware-Detection数据集,许多经典的研究工作得以展开。例如,N.Baltaci在其硕士论文中利用该数据集比较了多种分类算法在移动恶意软件检测中的性能。此外,该数据集还激发了更多关于移动设备安全的研究,推动了机器学习在移动安全领域的应用和发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作