SafeProtein-Bench

Name: SafeProtein-Bench
Creator: 北京大学
Published: 2025-09-04 01:13:56
License: 暂无描述

arXiv2025-09-04 更新2025-09-05 收录

下载链接：

https://responsiblebiodesign.ai

下载链接

链接失效反馈

官方服务：

资源简介：

SafeProtein-Bench是一个针对蛋白质基础模型的对抗性测试基准数据集，包含了一个手动构建的对抗性测试基准数据集和一个全面的评估协议。该数据集包括429个蛋白质，包括毒素和病毒蛋白，旨在评估蛋白质基础模型的安全性，并揭示当前蛋白质基础模型中存在的潜在生物安全风险。

SafeProtein-Bench is an adversarial test benchmark dataset for protein foundation models, which includes a manually curated adversarial test dataset and a comprehensive evaluation protocol. This dataset encompasses 429 proteins, including toxins and viral proteins, and aims to evaluate the safety of protein foundation models and reveal potential biosafety risks present in current protein foundation models.

提供机构：

北京大学

创建时间：

2025-09-04

搜集汇总

数据集介绍

构建方式

SafeProtein-Bench数据集的构建聚焦于生物安全风险相关的蛋白质，主要涵盖毒素和病毒蛋白类别。构建过程始于从HHS与USDA筛选病原体及毒素列表中检索相关条目，并进一步扩展至UniProt数据库中标注为毒素关键词的蛋白质。为确保结构数据的可靠性，仅保留具有实验测定晶体结构的蛋白质，并依据常见实践排除长度不足30或超过1000氨基酸的序列。最终数据集包含429个经过人工核查的蛋白质条目，每个条目均配备详细的序列信息、结构数据、保守性谱及掩码序列输入。

特点

该数据集的核心特点在于其针对蛋白质基础模型红队测试的专业性设计。其覆盖的蛋白质类型均具有明确的生物安全风险属性，如神经毒素与病毒功能蛋白，从而能够有效评估模型生成有害内容的风险。数据集整合了多模态信息，包括序列保守性注释与结构数据，并提供了三种掩码策略（保守掩码、随机掩码及尾部掩码）以模拟不同难度的对抗测试场景。此外，其评估协议采用严格的序列与结构联合标准，通过序列同一性与结构RMSD双指标判定 jailbreak 成功，显著降低了误报可能性。

使用方法

SafeProtein-Bench的使用旨在系统评估蛋白质基础模型在对抗性生成中的脆弱性。用户可通过加载数据集中的掩码序列与结构提示，输入目标模型进行序列重建任务。评估时需计算生成序列与原始序列的同一性百分比，并利用ESMfold等工具预测结构以计算RMSD值。最终结果需依据预设的掩码比例阈值（如0.5掩码时要求序列同一性≥80%且RMSD≤2.0Å）判定 jailbreak 是否成功。该流程支持多策略测试，包括基于Foldseek的良性结构引导与启发式束搜索，以全面探测模型的安全边界。

背景与挑战

背景概述

蛋白质作为生命活动的核心执行者，其功能设计与安全性评估一直是生物计算领域的关键课题。2025年，由北京大学、斯坦福大学、普林斯顿大学等多机构联合团队开发的SafeProtein-Bench数据集应运而生，旨在系统评估蛋白质基础模型的生物安全风险。该数据集聚焦于病毒蛋白与毒素蛋白的对抗性测试，通过整合多模态提示工程与启发式束搜索技术，首次构建了针对蛋白质生成模型的红队测试基准，为生物安全治理提供了重要数据支撑。

当前挑战

该数据集需解决蛋白质基础模型在生成有害蛋白质时的双用途风险问题，其核心挑战在于设计兼具生物学意义与对抗有效性的多模态提示策略，同时需克服模型训练中已植入的安全过滤机制。构建过程中需精确筛选具有晶体结构的毒性蛋白，并设计联合序列-结构相似性评估标准以降低误报率，此外还需在有限的计算资源下平衡结构预测的精度与效率。

常用场景

经典使用场景

在蛋白质基础模型的安全性评估领域，SafeProtein-Bench数据集被广泛应用于系统性的红队测试实验。该数据集通过整合病毒和毒素蛋白的手工筛选条目，结合多种序列掩蔽策略和结构相似性评估协议，为研究人员提供了一个标准化的测试平台。其典型应用场景包括对ESM3和DPLM2等先进模型进行对抗性生成测试，以评估模型在掩蔽恢复任务中的表现，特别是在保守位点掩蔽情境下检测模型是否能够重构具有生物安全风险的蛋白质功能域。

衍生相关工作

该数据集催生了多个蛋白质安全研究的重要方向。基于其评估框架，后续研究扩展了多模态提示攻击策略，如结合Foldseek结构相似性搜索的对抗性生成方法。相关工作还发展了更严格的联合序列-结构评估指标，并启发了针对蛋白质扩散模型的梯度引导解码技术。这些衍生工作共同推动了蛋白质红队测试从单一序列恢复向多功能域重构评估的演进，为构建下一代蛋白质基础模型的安全防护体系提供了理论基础。

数据集最近研究