面向互联网信息内容过滤的智能算法攻防博弈平台数据

Name: 面向互联网信息内容过滤的智能算法攻防博弈平台数据
Creator: 北京百度网讯科技有限公司
License: 暂无描述

国家基础学科公共科学数据中心2026-01-30 收录

下载链接：

https://nbsdc.cn/general/dataDetail?id=6974eca5195d264c7416d55e&type=1

下载链接

链接失效反馈

官方服务：

资源简介：

本数据集是“智能算法模型安全与攻防博弈技术”课题的验证数据核心，服务于“智能算法攻防博弈平台”的构建与性能评测。数据集严格对标三项技术指标：（1）验证3类以上开源攻击算法及3种以上主流框架的支持情况；（2）验证平台对风险内容（敏感、涉黄、暴恐、违禁）的过滤功能正确性；（3）量化评估对抗环境下内容过滤模型的准确率与召回率。数据集共包含三大部分：（1）文本测试数据：包含3个独立的Excel文件，分别对应角色扮演、形近字替换、拼音随机替换三种文本对抗算法，总计包含 5,000条原始文本和15,000对抗样本；（2）图像测试数据：包含1个索引Excel文件与配套的图像文件集，包含5,000张原始图像与经由PGD-FMKD、CW-R2CE、HSJA三种攻击算法生成的共 75，000张对抗样本图像。（3）算法验证数据：包含上述攻击算法的开源代码、环境配置文件及在主流深度学习框架下的运行日志，用于验证算法的可复现性与平台的多框架支持能力。

提供机构：

北京百度网讯科技有限公司

搜集汇总

数据集介绍

背景与挑战

背景概述

该数据集是用于构建和评测智能算法攻防博弈平台的核心验证数据，旨在评估内容过滤模型在对抗环境下的性能。它包含文本对抗样本、图像对抗样本以及相关攻击算法的验证代码，总数据量达126.43GB。

以上内容由遇见数据集搜集并总结生成