面向互联网信息内容过滤的智能算法攻防博弈平台数据
收藏国家基础学科公共科学数据中心2026-01-30 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=6974eca5195d264c7416d55e&type=1
下载链接
链接失效反馈官方服务:
资源简介:
本数据集是“智能算法模型安全与攻防博弈技术”课题的验证数据核心,服务于“智能算法攻防博弈平台”的构建与性能评测。数据集严格对标三项技术指标:(1)验证3类以上开源攻击算法及3种以上主流框架的支持情况;(2)验证平台对风险内容(敏感、涉黄、暴恐、违禁)的过滤功能正确性;(3)量化评估对抗环境下内容过滤模型的准确率与召回率。
数据集共包含三大部分:(1)文本测试数据:包含3个独立的Excel文件,分别对应角色扮演、形近字替换、拼音随机替换三种文本对抗算法,总计包含 5,000条原始文本和15,000对抗样本;(2)图像测试数据:包含1个索引Excel文件与配套的图像文件集,包含5,000张原始图像与经由PGD-FMKD、CW-R2CE、HSJA三种攻击算法生成的共 75,000张 对抗样本图像。(3)算法验证数据:包含上述攻击算法的开源代码、环境配置文件及在主流深度学习框架下的运行日志,用于验证算法的可复现性与平台的多框架支持能力。
提供机构:
北京百度网讯科技有限公司
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是用于构建和评测智能算法攻防博弈平台的核心验证数据,旨在评估内容过滤模型在对抗环境下的性能。它包含文本对抗样本、图像对抗样本以及相关攻击算法的验证代码,总数据量达126.43GB。
以上内容由遇见数据集搜集并总结生成



