FedAD-Bench

arXiv2024-08-08 更新2024-08-12 收录

下载链接：

http://arxiv.org/abs/2408.04442v1

下载链接

链接失效反馈

资源简介：

FedAD-Bench是由德国人工智能研究中心（DFKI）和RPTU Kaiserslautern-Landau共同创建的一个统一基准，专门用于评估联邦学习环境下的无监督异常检测算法。该数据集包含来自医疗和网络安全领域的四个数据集，每个数据集都有不同的样本数量和特征维度。数据集的创建过程特别关注于排除训练集中的异常数据，以确保模型能够更好地学习正常数据的特征。FedAD-Bench主要应用于提高数据隐私和安全性的领域，特别是在网络安全和医疗记录分析中，旨在通过联邦学习方法解决数据隐私保护和异常检测的问题。

FedAD-Bench is a unified benchmark jointly developed by the German Research Center for Artificial Intelligence (DFKI) and RPTU Kaiserslautern-Landau, dedicated to evaluating unsupervised anomaly detection algorithms in federated learning scenarios. This benchmark comprises four datasets originating from healthcare and cybersecurity domains, each featuring distinct sample sizes and feature dimensions. During the dataset creation process, special emphasis was placed on excluding anomalous samples from the training set, thereby enabling models to better capture the inherent patterns of normal data. FedAD-Bench is primarily utilized in domains prioritizing data privacy and security, particularly in cybersecurity and medical record analysis, with the goal of addressing the dual challenges of data privacy preservation and anomaly detection via federated learning approaches.

提供机构：

德国人工智能研究中心 (DFKI)

创建时间：

2024-08-08

AI搜集汇总

数据集介绍

构建方式

FedAD-Bench的构建方式旨在为联邦学习环境中的无监督异常检测算法提供一个统一的评估平台。该数据集包含了多个不同的数据集和评估指标，以提供一个全面的评估。为了确保模型能够准确地学习正常数据的特征，FedAD-Bench采用了重新设计的数据分割方法，将所有异常数据排除在训练集之外。此外，FedAD-Bench还采用了统一的评估指标集，包括精确率、召回率、AUROC、AUPR和F1分数，以提供一个全面的模型性能评估。在联邦学习方面，FedAD-Bench采用了FedAvg聚合算法，并通过实验评估了FedProx算法的性能。

特点

FedAD-Bench具有几个关键特点。首先，它支持联邦学习，旨在评估在联邦环境中运行的异常检测方法。其次，FedAD-Bench采用了重新设计的数据分割方法，将所有异常数据排除在训练集之外，以提高模型的异常检测能力。此外，FedAD-Bench采用了统一的评估指标集，包括精确率、召回率、AUROC、AUPR和F1分数，以提供一个全面的模型性能评估。最后，FedAD-Bench还采用了FedAvg和FedProx聚合算法，以评估不同的聚合策略对模型性能的影响。

使用方法

使用FedAD-Bench进行异常检测评估的方法如下：首先，将所有异常数据排除在训练集之外，以确保模型能够准确地学习正常数据的特征。然后，使用FedAvg或FedProx聚合算法进行模型训练和聚合。在评估阶段，使用统一的评估指标集，包括精确率、召回率、AUROC、AUPR和F1分数，对模型的性能进行全面评估。最后，根据评估结果，可以比较不同异常检测算法的性能，并选择最适合联邦学习环境的算法。

背景与挑战

背景概述

在联邦学习（FL）和异常检测相结合的背景下，FedAD-Bench数据集应运而生。该数据集由德国人工智能研究中心（DFKI）和特里尔-波恩技术大学（RPTU）的研究团队创建，旨在评估在联邦学习环境中无监督异常检测算法的性能。FedAD-Bench数据集的创建源于对联邦学习在保护隐私的同时利用分布式数据的潜力，以及将联邦学习与异常检测相结合，以检测来自多个敏感数据源的稀有且关键的异常。该数据集通过系统性分析和比较在联邦设置下深度学习异常检测模型的表现，填补了在联邦学习环境中评估异常检测方法性能的研究空白。FedAD-Bench数据集包含了多样化的数据集和指标，以提供全面评估，并旨在建立标准化基准，以指导未来在联邦异常检测领域的研究和开发，促进研究的可重复性和公平比较。

当前挑战

FedAD-Bench数据集面临的挑战包括：1) 异常检测方法在联邦学习环境中的评估仍然是一个未被充分探索的领域；2) 构建过程中所遇到的挑战，例如模型聚合效率低下和指标不可靠。此外，FedAD-Bench数据集还揭示了联邦学习在正则化效应方面的洞察，表明在特定情况下，联邦学习由于其固有的减少过拟合的能力而优于集中式方法。然而，联邦学习在异常检测中的应用仍然面临着一些挑战，包括模型复杂度、数据集的多样性以及模型聚合策略的选择等。

常用场景

经典使用场景

FedAD-Bench数据集主要用于评估在联邦学习环境中无监督异常检测算法的性能。它涵盖了各种数据集和指标，为联邦学习中的异常检测提供了一个全面的评估框架。FedAD-Bench的设计考虑了联邦学习的特性，包括支持联邦学习、重新设计的数据分割和统一的一组评估指标，以确保评估的准确性和公正性。

衍生相关工作

FedAD-Bench数据集的发布衍生了一系列相关的研究工作。这些研究工作包括对联邦学习中异常检测算法的性能分析、对不同聚合策略的比较、以及评估指标的可靠性研究。FedAD-Bench的发布为联邦学习中的异常检测研究提供了一个重要的基础，促进了该领域的进一步发展。

数据集最近研究