PRBench

Name: PRBench
Creator: WMG, University of Warwick; Department of Computer Science, University of Liverpool; Center for Frontier AI Research, A*STAR, Singapore; School of Computing, National University of Singapore
Published: 2025-11-04 00:33:57
License: 暂无描述

arXiv2025-11-04 更新2025-11-06 收录

下载链接：

https://mmatspscegit.io/PRBenchLeaderboard/

下载链接

链接失效反馈

官方服务：

资源简介：

PRBench是一个致力于评估提高概率鲁棒性（PR）的训练方法的基准。它通过一套全面的指标比较了对抗性训练（AT）和PR目标训练方法。该基准包括基于7个广泛采用的数据库和10种模型架构的222个训练模型。

PRBench is a benchmark dedicated to evaluating training methods for enhancing probabilistic robustness (PR). It compares adversarial training (AT) and PR-objective training methods via a comprehensive suite of metrics. This benchmark includes 222 trained models based on 7 widely adopted datasets and 10 model architectures.

提供机构：

WMG, University of Warwick; Department of Computer Science, University of Liverpool; Center for Frontier AI Research, A*STAR, Singapore; School of Computing, National University of Singapore

创建时间：

2025-11-04

搜集汇总

数据集介绍

构建方式

PRBench作为首个专注于概率鲁棒性评估的基准，其构建过程体现了系统化的设计理念。该数据集通过整合7个广泛使用的视觉数据集（包括MNIST、CIFAR系列和ImageNet子集）和10种主流模型架构，构建了包含222个训练模型的完整评估体系。在训练方法选择上，PRBench全面纳入了标准训练、6种对抗训练方法、4种基于风险的训练方法以及混合方法AT-PR，通过统一的超参数设置和评估协议确保了实验的可比性。数据集的构建特别注重对扰动分布的覆盖，在评估阶段采用均匀分布、高斯分布和拉普拉斯分布三种噪声类型来模拟真实环境中的随机扰动。

使用方法

使用PRBench进行模型评估需要遵循标准化的流程。研究人员首先需要选择适用的训练方法在支持的数据集上进行模型训练，然后通过基准提供的统一接口进行多维度评估。评估过程需同时考察清洁准确率、对抗鲁棒性（使用PGD、C&W和Auto-Attack等攻击方法）、概率鲁棒性（在不同扰动半径和分布下）以及泛化误差等核心指标。特别需要注意的是，概率鲁棒性的评估应基于正确分类的原始样本进行计算，以准确反映模型的真实鲁棒性。基准的公开排行榜机制支持不同方法间的横向比较，而理论分析工具则有助于深入理解不同训练方法的内在机理。

背景与挑战

背景概述

PRBench作为首个专注于概率鲁棒性评估的基准数据集，由华威大学、利物浦大学及新加坡科技研究局等机构的研究团队于2025年联合提出。该数据集针对深度学习模型在随机扰动下的稳定性问题，通过系统化评估对抗训练与概率鲁棒性专项训练方法的性能，填补了现有研究仅关注对抗鲁棒性的空白。其核心价值在于构建了涵盖7个数据集、10种模型架构的222个训练模型，为理解概率鲁棒性与对抗鲁棒性的内在关联提供了实证基础。

当前挑战

PRBench面临的领域挑战在于突破传统对抗鲁棒性评估的局限，建立概率鲁棒性这一新兴指标的统一度量标准。其构建过程需解决三大难题：首先，需整合异构训练方法并设计覆盖清洁准确率、鲁棒性泛化误差等多维度的评估体系；其次，需在生成大量对抗样本时平衡计算效率与评估可靠性；最后，需通过理论分析揭示不同训练方法在概率鲁棒性泛化能力上的本质差异，为后续研究提供可扩展的基准框架。

常用场景

经典使用场景

在深度学习安全研究领域，PRBench作为首个专注于概率鲁棒性评估的基准测试平台，其经典应用场景体现在系统化比较不同训练方法对模型概率鲁棒性的提升效果。该数据集通过整合7个主流视觉数据集和10种网络架构，构建了包含222个训练模型的评估体系，为研究者提供了标准化的实验环境。在对抗性训练与概率鲁棒性训练的横向对比中，研究人员能够基于统一度量指标（包括清洁准确率、PR/AR性能、训练效率等）客观分析各类方法的优劣，这种多维度的评估框架显著推进了概率鲁棒性研究范式的规范化进程。

解决学术问题

PRBench有效解决了概率鲁棒性研究领域长期存在的三大核心问题：首先通过建立统一评估标准消除了不同训练方法间的不可比性，其次系统揭示了对抗性训练在提升概率鲁棒性方面的潜在优势，最后通过理论分析框架阐明了不同训练方法的泛化误差特性。该数据集首次实证证明了“免费概率鲁棒性”现象——即专注于提升对抗鲁棒性的训练方法能同步增强概率鲁棒性，这一发现促使学界重新审视两类鲁棒性间的内在关联。通过推导基于均匀稳定性分析的泛化误差上界，该工作为理解概率鲁棒性训练的泛化行为提供了理论支撑。

实际应用

在实际部署场景中，PRBench的评估结论为安全攸关领域的模型选择提供了重要参考。自动驾驶系统通过采用该基准验证的对抗性训练方法，可在保持高清洁准确率的同时获得优异的概率鲁棒性，确保系统在随机扰动环境下维持稳定性能。医疗诊断模型借助该数据集的评估框架，能够量化模型在噪声干扰下的可靠性概率，为实际应用中的风险控制提供统计依据。工业质量控制系统中，基于PRBench比较结果的模型优化方案，可在保证检测精度的前提下显著提升对生产环境中随机扰动的容忍度，这种平衡性能与鲁棒性的特性对实际工程部署具有显著价值。

数据集最近研究