five

AndroMalPack-Dataset

收藏
github2021-12-14 更新2024-05-31 收录
下载链接:
https://github.com/hasnainrafique/AndroMalPack-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
AndroMalPack数据集包含基于包名重用的三个基准Android恶意软件数据集(Drebin、AMD和Androzoo)中重新打包的Android恶意软件应用的加密哈希。该数据集由三个.csv文件组成,每个文件分别包含Drebin、AMD和Androzoo数据集中重新打包恶意软件应用的哈希。由于Drebin、AMD和Androzoo数据集限制了未经授权的访问,因此不提供重新打包的恶意软件的APK文件。AndroMalPack数据集提供的哈希可用于从Drebin、AMD和Androzoo数据集中过滤基于包名重用的重新打包APK。每个.csv文件包含两列,第一列包含加密哈希,第二列包含相应的APK包名。Drebin和Androzoo数据集使用SHA256哈希标记每个应用,而AMD数据集使用MD5哈希。同样,AndroMalPack数据集对Drebin和Androzoo使用SHA256哈希,对AMD数据集使用MD5哈希来表示基于包名重用的重新打包应用。

The AndroMalPack dataset comprises encrypted hashes of repackaged Android malware applications from three benchmark Android malware datasets (Drebin, AMD, and Androzoo) based on package name reuse. This dataset consists of three .csv files, each containing the hashes of repackaged malware applications from the Drebin, AMD, and Androzoo datasets, respectively. Due to restricted unauthorized access to the Drebin, AMD, and Androzoo datasets, the APK files of the repackaged malware are not provided. The hashes provided by the AndroMalPack dataset can be used to filter repackaged APKs based on package name reuse from the Drebin, AMD, and Androzoo datasets. Each .csv file contains two columns: the first column includes the encrypted hash, and the second column contains the corresponding APK package name. The Drebin and Androzoo datasets use SHA256 hashes to tag each application, whereas the AMD dataset uses MD5 hashes. Similarly, the AndroMalPack dataset employs SHA256 hashes for Drebin and Androzoo and MD5 hashes for the AMD dataset to represent repackaged applications based on package name reuse.
创建时间:
2021-12-14
原始信息汇总

AndroMalPack-Dataset 概述

数据集组成

  • 文件类型:包含三个 .csv 文件。
  • 内容:每个文件分别包含基于包名重用的 Drebin、AMD 和 Androzoo 数据集中重新打包的恶意软件应用的加密散列。

数据集内容详情

  • 散列类型
    • Drebin 和 Androzoo 数据集使用 SHA256 散列。
    • AMD 数据集使用 MD5 散列。
  • 文件结构
    • 每个 .csv 文件包含两列:
      • 第一列:加密散列。
      • 第二列:对应的 APK 包名。

数据集用途

  • 目的:用于从 Drebin、AMD 和 Androzoo 数据集中过滤基于包名重用的重新打包 APK。
  • 限制:由于 Drebin、AMD 和 Androzoo 数据集限制未授权访问,本数据集不提供重新打包的恶意软件的 APK 文件。
搜集汇总
数据集介绍
main_image_url
构建方式
AndroMalPack-Dataset的构建基于三个基准Android恶意软件数据集(Drebin、AMD和Androzoo),通过重用包名的方式识别并提取了重新打包的恶意应用程序的加密哈希值。数据集以三个.csv文件的形式呈现,每个文件分别对应Drebin、AMD和Androzoo数据集中重新打包的恶意应用程序的哈希值。由于原始数据集的访问受限,AndroMalPack并未提供APK文件,而是通过哈希值帮助用户从原始数据集中筛选出重新打包的应用程序。每个.csv文件包含两列,第一列为加密哈希值,第二列为对应的APK包名。Drebin和Androzoo数据集使用SHA256哈希值,而AMD数据集使用MD5哈希值,AndroMalPack也相应地采用了相同的哈希算法。
特点
AndroMalPack-Dataset的核心特点在于其专注于重新打包的Android恶意应用程序的识别。通过重用包名的方式,数据集提供了Drebin、AMD和Androzoo数据集中重新打包的恶意应用程序的加密哈希值。这种设计使得研究人员能够在不直接访问原始APK文件的情况下,高效地筛选和分析重新打包的恶意软件。此外,数据集采用了与原始数据集一致的哈希算法(SHA256和MD5),确保了数据的兼容性和一致性。这种结构化的数据形式为恶意软件检测和重新打包行为的研究提供了重要的基础支持。
使用方法
AndroMalPack-Dataset的使用方法主要围绕其提供的加密哈希值展开。研究人员可以通过加载数据集中的.csv文件,获取重新打包的恶意应用程序的哈希值和包名信息。这些哈希值可用于从Drebin、AMD和Androzoo数据集中筛选出对应的APK文件,从而进一步分析重新打包的恶意软件行为。由于数据集未提供APK文件本身,用户需结合原始数据集进行深入研究。通过这种方式,AndroMalPack-Dataset为恶意软件检测、重新打包行为分析以及Android安全研究提供了高效的工具和数据支持。
背景与挑战
背景概述
AndroMalPack-Dataset是一个专注于Android恶意软件重打包行为的数据集,由研究人员基于Drebin、AMD和Androzoo三个基准Android恶意软件数据集构建而成。该数据集的核心研究问题在于通过包名重用来识别和过滤重打包的恶意应用程序。AndroMalPack-Dataset的创建旨在为恶意软件检测领域提供一种高效的工具,帮助研究人员快速识别和分析重打包的恶意软件样本。该数据集通过提供加密哈希值和对应的包名信息,为相关领域的研究提供了重要的数据支持,推动了Android恶意软件检测技术的发展。
当前挑战
AndroMalPack-Dataset在解决Android恶意软件重打包检测问题时面临多重挑战。首先,重打包恶意软件的识别依赖于包名重用,而包名重用本身可能受到多种因素的影响,如开发者命名习惯的差异,这增加了准确识别的难度。其次,由于Drebin、AMD和Androzoo数据集本身对未授权访问的限制,AndroMalPack-Dataset无法直接提供APK文件,仅能通过哈希值进行间接过滤,这在一定程度上限制了数据集的实用性。此外,数据集构建过程中需要处理不同哈希算法(如SHA256和MD5)的兼容性问题,这对数据的一致性和完整性提出了更高的要求。这些挑战共同构成了AndroMalPack-Dataset在研究和应用中的主要难点。
常用场景
经典使用场景
AndroMalPack-Dataset在安卓恶意软件研究领域中被广泛用于识别和分析重打包的恶意应用程序。通过提供Drebin、AMD和Androzoo数据集中重打包应用的加密哈希值,研究者可以有效地筛选出这些数据集中的重打包应用,进而进行深入的安全分析。这一数据集的使用场景主要集中在恶意软件检测、重打包行为分析以及安卓应用安全评估等领域。
实际应用
在实际应用中,AndroMalPack-Dataset被广泛用于安卓应用市场的安全监控和恶意软件检测。安全公司可以利用该数据集中的哈希值,快速筛查出潜在的重打包恶意应用,从而保护用户免受恶意软件的侵害。此外,该数据集还可用于开发自动化工具,帮助应用商店和开发者识别和移除重打包的应用,提升整体应用生态的安全性。
衍生相关工作
基于AndroMalPack-Dataset,研究者们开发了多种恶意软件检测和重打包应用识别的算法和工具。例如,一些研究利用该数据集中的哈希值,结合机器学习技术,开发了高效的重打包应用检测模型。此外,该数据集还催生了一系列关于安卓应用安全的研究论文,进一步推动了该领域的技术发展和理论创新。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作