FiveDirections

github2025-03-21 更新2025-03-22 收录

下载链接：

https://github.com/kunmukh/provdp

下载链接

链接失效反馈

官方服务：

资源简介：

FiveDirections数据集包含500个良性溯源图，用于差分隐私处理。处理后的输出为500个经过差分隐私处理的良性溯源图。

The FiveDirections Dataset contains 500 benign provenance graphs for differential privacy processing. The processed output consists of 500 differentially private benign provenance graphs.

创建时间：

2025-03-18

原始信息汇总

ProvDP: 系统溯源数据集的差分隐私保护

数据集概述

数据集名称：ProvDP
用途：为系统溯源数据集提供差分隐私保护
相关论文：ProvDP: Differential Privacy for System Provenance Dataset (ACNS 25)

数据内容

原始数据
- 来源：FiveDirections数据集
- 类型：500个良性溯源图
- 路径：DP/FiveDirections/benign-500/
处理后数据
- 类型：500个经过差分隐私处理的良性溯源图
- 路径：DP/FiveDirections/benign-500-dp_N=500_epsilon=1.0_delta=0.5_alpha=0.7_beta=0.1_gamma=0.1_eta=0.1_k=0.1/
GNN检测数据
- 原始良性/恶意图路径：GNN-based-IDS/Data/FiveDirections/
- DP处理后的图路径：GNN-based-IDS/Data/FiveDirections-DP/

数据处理方法

核心算法：差分隐私算法
关键参数：
- ε (epsilon): 隐私预算
- α, β, γ, η: 算法参数
执行命令： shell python -m src.cli.perturb -i ../FiveDirections/benign-500 -o ../FiveDirections/benign-500-dp --epsilon 1 --alpha 0.7 --beta 0.1 --gamma 0.1 --eta 0.1

引用格式

bibtex @inproceedings{mukherjee2025provDP, title = {ProvDP: Differential Privacy for System Provenance Dataset}, author = {Kunal Mukherjee and Jonathan Yu and Partha De and Dinil Mon Divakaran}, year = 2025, booktitle = {23rd Conference on Applied Cryptography and Network Security (ACNS)}, series = {ACNS 25} }

搜集汇总

数据集介绍

构建方式

FiveDirections数据集的构建依托于DARPA透明计算项目，专注于系统溯源图的生成与分析。该数据集通过捕获系统调用序列，构建了500个良性溯源图，并进一步利用差分隐私算法对这些图进行处理，生成了具有隐私保护特性的衍生数据集。数据集的构建过程严格遵循科学实验流程，确保了数据的可靠性与可重复性。

特点

FiveDirections数据集的核心特点在于其结合了系统溯源图与差分隐私技术，提供了500个良性溯源图及其经过隐私处理的版本。数据集不仅包含原始的系统调用序列，还通过ProvDP算法生成了具有隐私保护特性的衍生数据，适用于隐私保护与异常检测的研究。此外，数据集还支持基于图神经网络（GNN）的入侵检测系统（IDS）实验，为系统安全研究提供了丰富的实验材料。

使用方法

使用FiveDirections数据集时，用户需首先配置虚拟环境并安装相关依赖。通过运行ProvDP脚本，用户可对原始良性溯源图进行差分隐私处理，生成具有隐私保护特性的衍生数据。对于基于GNN的入侵检测实验，用户可调用ProvNinja脚本，加载FiveDirections目录中的良性或恶意溯源图进行模型训练与测试。数据集的使用流程清晰，支持多种实验场景，为系统安全与隐私保护研究提供了便捷的工具链。

背景与挑战

背景概述

FiveDirections数据集是一个专注于系统溯源图（System Provenance Graphs）的数据集，旨在支持基于图神经网络的入侵检测系统（GNN-based IDS）的研究。该数据集由DARPA透明计算项目支持，主要研究人员包括Kunal Mukherjee等人，其核心研究问题在于如何通过系统溯源图检测恶意行为。FiveDirections数据集在2023年首次公开，并迅速成为系统安全领域的重要资源，特别是在结合差分隐私（Differential Privacy）技术的研究中展现了其独特价值。该数据集不仅为研究者提供了丰富的良性与恶意溯源图样本，还为差分隐私算法的验证与优化提供了实验基础。

当前挑战

FiveDirections数据集在应用过程中面临多重挑战。首先，系统溯源图的复杂性和高维度特性使得基于图神经网络的入侵检测模型训练难度较大，尤其是在处理大规模图数据时，计算资源消耗显著增加。其次，差分隐私技术的引入虽然增强了数据隐私保护，但也带来了数据可用性与隐私保护之间的权衡问题，如何在保证隐私的同时不显著降低检测模型的性能是一个关键挑战。此外，数据集的构建过程中，如何准确区分良性行为与恶意行为，并确保数据标注的准确性，也是一个技术难点。这些挑战共同推动了系统安全与隐私保护领域的深入研究与技术创新。

常用场景

经典使用场景

FiveDirections数据集在系统溯源图分析领域具有广泛应用，特别是在差分隐私保护的研究中。该数据集常用于构建和测试差分隐私算法，如ProvDP，以保护系统溯源图中的敏感信息。通过处理500个良性溯源图，研究者能够评估算法在不同隐私预算下的表现，确保数据在发布时既保持实用性又满足隐私保护要求。

实际应用

在实际应用中，FiveDirections数据集被用于开发高效的入侵检测系统（IDS），如ProvNinja和Prov-GAT。这些系统能够通过分析良性及恶意溯源图，检测系统中的异常行为。差分隐私技术的引入进一步增强了系统的安全性，使其能够在保护用户隐私的同时，有效识别潜在的安全威胁。

衍生相关工作

FiveDirections数据集衍生了一系列经典研究工作，包括ProvDP差分隐私算法和基于图神经网络（GNN）的入侵检测系统Prov-GAT。这些工作不仅推动了系统溯源数据隐私保护技术的发展，还为后续研究提供了重要的实验基础。例如，Prov-GAT通过结合图注意力机制，显著提升了异常检测的准确性和效率。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集