Ghera

Name: Ghera
Creator: 堪萨斯州立大学
Published: 2017-08-08 14:29:02
License: 暂无描述

arXiv2017-08-08 更新2024-06-21 收录

下载链接：

http://bitbucket.org/secure-it-i/android-app-vulnerability-benchmarks

下载链接

链接失效反馈

官方服务：

资源简介：

Ghera是由堪萨斯州立大学创建的一个开源数据集，专注于Android应用的安全漏洞。该数据集包含25个基准，每个基准都是一对应用，展示了一个特定的已知Android应用漏洞。数据集涵盖了Android框架的四个主要领域：组件间通信（ICC）、存储、系统和Web。Ghera的创建旨在为评估现有和新漏洞检测技术提供一个全面、最新的基准库，帮助开发者了解和防范Android应用中的安全漏洞。

Ghera is an open-source dataset created by Kansas State University, focusing on security vulnerabilities in Android applications. This dataset includes 25 benchmarks, each consisting of a pair of applications that showcase a specific known Android application vulnerability. The dataset covers four primary domains of the Android framework: Inter-Component Communication (ICC), storage, system, and Web. Ghera was developed to provide a comprehensive and up-to-date benchmark repository for evaluating both existing and novel vulnerability detection technologies, and to assist developers in understanding and mitigating security vulnerabilities in Android applications.

提供机构：

堪萨斯州立大学

创建时间：

2017-08-08

搜集汇总

数据集介绍

构建方式

在移动安全研究领域，构建高质量漏洞基准数据集对评估检测工具至关重要。Ghera数据集的构建遵循系统化方法，首先基于Android框架的四大核心能力——组件间通信、存储、系统及网络交互——对已知漏洞进行分类。研究团队深入分析相关API，通过审查学术文献、开源项目及社区讨论识别潜在漏洞模式。针对每个漏洞，精心开发一对应用：良性应用展现特定漏洞，恶意应用则设计相应攻击向量。所有漏洞均通过实际执行验证，确保其真实可复现，并明确标注兼容的Android版本范围。

特点

Ghera数据集具备多重独特属性，使其在安全基准数据集中脱颖而出。其核心特征在于工具无关性，避免偏向特定检测技术，保障评估的公平性。数据集采用双重结构，每个漏洞均包含良性应用与恶意攻击应用对，完整呈现漏洞产生与利用链条。所有基准应用均保持精炼性，聚焦于核心漏洞特征，避免无关代码干扰。同时，数据集提供详尽文档，涵盖漏洞描述、利用说明及构建指南，并标注明确的Android版本兼容性，确保评估的版本一致性。

使用方法

该数据集设计注重易用性与可复现性。用户可通过标准Android开发工具链直接使用，每个基准案例均提供完整源代码与构建脚本。典型使用流程包括：配置相应版本的Android虚拟设备，使用Gradle构建工具编译安装良性应用与恶意应用，在模拟器中依次运行两者以触发漏洞，最后通过日志分析验证攻击是否成功。对于涉及网络交互的漏洞，数据集额外提供本地服务器配置指南。这种标准化工作流程降低了使用门槛，使研究人员能够快速开展漏洞检测工具的评估与比较工作。

背景与挑战

背景概述

在移动安全研究领域，Android平台因其开放性与普及性，其应用程序的安全漏洞检测技术发展迅速，但长期缺乏系统化的基准测试集以支撑严谨的评估工作。2017年，堪萨斯州立大学的Joydeep Mitra与Venkatesh-Prasad Ranganath共同创建了Ghera数据集，旨在构建一个开源、全面的Android应用漏洞基准库。该数据集的核心研究问题聚焦于如何为漏洞检测工具提供可靠、可复现的评估基准，从而推动自动化安全分析技术的进步。Ghera收录了涵盖ICC、存储、系统与Web四大类别的25种已知漏洞，以漏洞-攻击成对应用的形式呈现，为学术界与工业界提供了重要的实验基础，显著提升了安全工具评估的公平性与可比性。

当前挑战

Ghera数据集致力于解决Android应用漏洞自动化检测领域的核心挑战，即缺乏能够全面覆盖已知漏洞类型、且具备高度可信度的基准测试集。在构建过程中，研究团队面临多重挑战：其一，需确保基准的“工具无关性”，避免偏向特定检测技术；其二，维持漏洞的“真实性”，即每个基准必须精确包含所声称的漏洞，并能通过攻击应用验证；其三，实现“特征特异性”，使漏洞仅由特定API或功能引发，以准确评估工具的根本原因分析能力。此外，还需平衡基准的“精简性”与“上下文完整性”，使其既能快速验证工具基础效能，又能支持不同复杂场景下的评估。这些挑战的克服，为后续移动安全基准的构建树立了方法论典范。

常用场景

经典使用场景

在移动安全研究领域，Ghera数据集作为Android应用漏洞基准测试的权威资源，其经典使用场景聚焦于系统化评估漏洞检测工具的性能。研究者通过该数据集包含的25种已知漏洞对静态分析、动态分析及混合分析技术进行严谨测试，验证工具在跨组件通信、存储安全、系统权限和Web视图等核心模块的检测能力。这种标准化评估框架为学术界提供了可复现的实验基础，使得不同检测方法的准确率、召回率等关键指标能够在统一基准下进行公平比较，极大推动了Android安全分析技术的科学演进。

解决学术问题

Ghera数据集有效解决了Android安全研究中长期存在的基准测试缺失问题。传统研究往往依赖零散的漏洞案例或真实应用商店样本，导致评估结果缺乏可比性与可复现性。该数据集通过精心构建的漏洞-攻击应用对，为工具评估提供了真实且可控的实验环境，使研究者能够精确量化检测技术对特定漏洞类型的覆盖能力。其工具无关性、版本特异性及双重性设计，进一步确保了评估过程的严谨性，为漏洞检测算法的性能验证与优化提供了可靠依据，显著提升了该领域研究的科学性与系统性。

衍生相关工作

Ghera数据集的发布催生了系列重要的衍生研究工作。在学术层面，研究者以其为基础开发了增强型漏洞检测框架，如结合机器学习技术的混合分析方法，显著提升了复杂漏洞的识别精度。工业界则基于该数据集构建了扩展性基准测试平台，将漏洞类型扩展到新兴的物联网与车载系统领域。同时，数据集的双重性设计启发了新型动态分析工具的开发，这些工具能够模拟真实攻击链以验证漏洞可利用性。这些衍生工作共同推动了移动安全生态从单一检测向综合防护体系的演进，体现了基准数据集对技术发展的持续赋能作用。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集