five

Android Malware Genome Project, M0Droid Dataset, The Drebin Dataset, A Dataset based on ContagioDump, AndroMalShare

收藏
github2024-05-14 更新2024-05-31 收录
下载链接:
https://github.com/nuaa-wangj/Android-Malware-Datasets
下载链接
链接失效反馈
官方服务:
资源简介:
这些数据集包含了Android平台上的恶意软件样本,用于研究和分析Android恶意软件的行为和特征。

These datasets contain samples of malicious software on the Android platform, intended for researching and analyzing the behavior and characteristics of Android malware.
创建时间:
2016-03-02
原始信息汇总

数据集概述

1. Android Malware Genome Project

  • 描述: 该项目收集了超过1,200个Android恶意软件样本,覆盖了2010年8月至2011年10月期间的大多数Android恶意软件家族。
  • 出版物: Dissecting Android Malware: Characterization and Evolution. Yajin Zhou, Xuxian Jiang. Proceedings of the 33rd IEEE Symposium on Security and Privacy (Oakland 2012).
  • 主页: http://www.malgenomeproject.org (已停止数据集共享)

2. M0Droid Dataset

  • 描述: M0Droid是一个用于识别和分类Android恶意软件的工具,通过捕获系统调用请求来生成应用程序的行为签名。
  • 出版物: M0droid: An android behavioral-based malware detection model. Damshenas M, Dehghantanha A, Choo K K R, et al. Journal of Information Privacy and Security, 2015, 11(3): 141-157.
  • 主页: http://cyberscientist.org/m0droid-dataset/

3. The Drebin Dataset

  • 描述: 该数据集包含5,560个来自179个不同恶意软件家族的应用程序,收集时间为2010年8月至2012年10月。
  • 出版物: Drebin: Efficient and explainable detection of android malware in your pocket. Arp D, Spreitzenbarth M, Hubner M, et al. Proc. of 17th Network and Distributed System Security Symposium, NDSS. 14.
  • 主页: http://user.informatik.uni-goettingen.de/~darp/drebin/

4. A Dataset based on ContagioDump

5. AndroMalShare

6. Kharon Malware Dataset

  • 描述: Kharon数据集是一个完全逆向和文档化的恶意软件集合,用于评估研究实验。
  • 出版物: Kharon dataset: Android malware under a microscope. CIDRE, EPI. Learning from Authoritative Security Experiment Results (2016): 1.
  • 主页: http://kharon.gforge.inria.fr/dataset/

7. AMD Project

  • 描述: AMD包含24,553个样本,分为71个恶意软件家族,覆盖2010年至2016年。
  • 出版物: Android malware clustering through malicious payload mining. Li Y, Jang J, Hu X, et al. International Symposium on Research in Attacks, Intrusions, and Defenses. Springer, Cham, 2017: 192-214.
  • 主页: http://amd.arguslab.org

8. AAGM Dataset

  • 描述: AAGM数据集由1900个应用程序生成,通过在真实智能手机上安装应用程序半自动化捕获。
  • 出版物: Towards a Network-Based Framework for Android Malware Detection and Characterization. Arash Habibi Lashkari, Andi Fitriah A.Kadir, Hugo Gonzalez, Kenneth Fon Mbah and Ali A. Ghorbani. 15th International Conference on Privacy, Security and Trust, PST, Calgary, Canada, 2017.
  • 主页: http://www.unb.ca/cic/datasets/android-adware.html

9. Android PRAGuard Dataset

  • 描述: 该数据集包含10479个样本,通过七种不同的混淆技术对MalGenome和Contagio Minidump数据集进行混淆。
  • 出版物: Stealth attacks: an extended insight into the obfuscation effects on Android malware. Davide Maiorca, Davide Ariu, Igino Corona, Marco Aresu and Giorgio Giacinto. Computers and Security, vol. 51, pp. 16-31, 2015.
  • 主页: http://pralab.diee.unica.it/en/AndroidPRAGuardDataset

10. AndroZoo

  • 描述: AndroZoo是一个包含5,781,781个不同APK的集合,每个APK都由数十种不同的反病毒产品进行分析,以确定哪些应用程序被检测为恶意软件。
  • 出版物: AndroZoo: Collecting Millions of Android Apps for the Research Community. K. Allix, T. F. Bissyandé, J. Klein, and Y. Le Traon. Mining Software Repositories (MSR) 2016.
  • 主页: https://androzoo.uni.lu/
搜集汇总
数据集介绍
main_image_url
构建方式
在Android恶意软件研究领域,这些数据集的构建方式各具特色。Android Malware Genome Project通过系统化收集和分类,涵盖了2010年8月至2011年10月间的1200多个恶意软件样本。M0Droid Dataset则通过内核级钩子捕获应用程序的系统调用请求,生成行为签名以识别和分类恶意软件。The Drebin Dataset包含了2010年至2012年间收集的5560个应用程序,涵盖179个恶意软件家族。基于ContagioDump的数据集则通过分析恶意软件的主要行为进行分类。AndroMalShare项目专注于共享恶意软件样本,提供详细的扫描报告和检测结果。
使用方法
这些数据集的使用方法多样,适用于不同的研究需求。研究者可以通过分析Android Malware Genome Project的数据来研究恶意软件的演变和分类。M0Droid Dataset的行为模式识别工具可用于开发新的恶意软件检测模型。The Drebin Dataset的高样本数量和多样性使其适合用于训练和测试恶意软件检测算法。基于ContagioDump的数据集的行为分类可用于研究恶意软件的具体功能和攻击策略。AndroMalShare的共享机制和详细报告为研究者提供了丰富的资源,支持深入的恶意软件分析和检测研究。
背景与挑战
背景概述
随着移动设备的普及,Android平台的安全问题日益凸显,尤其是恶意软件的泛滥。Android Malware Genome Project、M0Droid Dataset、The Drebin Dataset、A Dataset based on ContagioDump以及AndroMalShare等数据集的创建,旨在系统化地研究Android恶意软件的特征与演变。这些数据集由多个研究机构和学者共同构建,涵盖了从2010年至2016年的大量恶意软件样本,涉及多种恶意软件家族。这些数据集的发布不仅为学术界提供了丰富的研究资源,也为工业界开发更有效的恶意软件检测工具提供了基础。
当前挑战
这些数据集在构建过程中面临诸多挑战。首先,恶意软件样本的收集与分类是一项复杂且耗时的任务,涉及从多个来源获取样本并进行行为分析。其次,恶意软件的快速演变使得数据集的更新与维护成为持续的挑战。此外,恶意软件的隐蔽性和多样性增加了检测与分类的难度,尤其是在面对新型恶意软件时,现有的检测方法可能失效。最后,数据集的共享与使用也面临法律和隐私方面的挑战,如何在保护用户隐私的同时进行有效的研究是一个亟待解决的问题。
常用场景
经典使用场景
这些Android恶意软件数据集的经典使用场景主要集中在恶意软件的分类与检测上。通过分析恶意软件的行为模式、系统调用、API调用等特征,研究人员能够构建高效的检测模型,识别并分类不同家族的恶意软件。例如,Drebin数据集通过分析应用程序的静态特征,成功识别了多种恶意软件家族,为恶意软件检测提供了强有力的支持。
解决学术问题
这些数据集解决了Android恶意软件研究中的关键学术问题,如恶意软件的分类、行为分析和演化趋势预测。通过系统化的数据收集与分析,研究人员能够深入理解恶意软件的行为模式,揭示其背后的攻击策略,并为构建更有效的防御机制提供理论基础。这些研究成果不仅推动了恶意软件检测技术的发展,还为移动安全领域的学术研究提供了宝贵的数据资源。
实际应用
在实际应用中,这些数据集为安全厂商、企业和研究机构提供了重要的工具和资源,用于开发和测试恶意软件检测系统。例如,安全厂商可以利用这些数据集训练和验证其反恶意软件引擎,提升检测的准确性和效率。此外,企业和研究机构也可以利用这些数据集进行内部安全评估,识别潜在的安全威胁,并制定相应的防护策略。
数据集最近研究
最新研究方向
在移动安全领域,Android恶意软件数据集的研究正朝着更精细化的分类和行为分析方向发展。随着Android平台恶意软件的多样性和复杂性不断增加,研究人员致力于通过深度学习和行为模式识别技术,提升恶意软件检测的准确性和效率。例如,基于行为特征的检测模型如M0Droid,通过内核级钩子捕获系统调用,生成应用程序行为签名,从而实现对恶意软件的精准分类。此外,AndroZoo等大规模数据集的发布,为研究者提供了丰富的样本资源,推动了跨平台恶意软件分析和多维度特征提取的研究。这些进展不仅提升了Android恶意软件的检测能力,也为移动安全领域的防御策略提供了新的思路和方法。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作