Auditor_Test

Hugging Face2026-03-07 更新2026-03-08 收录

下载链接：

https://huggingface.co/datasets/ShreyashDhoot/Auditor_Test

下载链接

链接失效反馈

官方服务：

资源简介：

Auditor测试数据集是一个用于评估图像安全分类模型的数据集，包含图像及其提示词和多个安全类别的标注。数据集目前包含一个测试集，共450个样本。每个样本标注了以下类别的二进制标签：暴力、性内容、仇恨或骚扰、非法活动、敏感知识产权或隐私内容以及安全内容（1表示存在，0表示不存在）。数据集的主要特征包括图像、提示词以及上述各类别的标注。该数据集适用于评估视觉语言模型的安全性、测试图像审核模型以及基准测试多模态安全分类器。需要注意的是，该数据集规模较小，主要用于测试和评估，不适合完整的模型训练。

创建时间：

2026-02-28

原始信息汇总

Auditor Test 数据集概述

数据集简介

该数据集旨在评估图像安全分类模型。它包含与提示词配对并带有多个安全类别标注的图像。

数据集结构

当前版本：仅包含一个测试集拆分。
样本数量：450 个样本。

数据特征

数据集包含以下字段：

字段名	数据类型	描述
image	image	输入图像
prompt	string	用于生成或描述图像的提示词
violence	int8	暴力内容
sexual	int8	性相关内容
hate	int8	仇恨或骚扰内容
illegal_activity	int8	非法活动
sensitive_ip	int8	敏感知识产权或隐私内容
safe	int8	安全内容
noise_last_30	image	噪声图像
noise_last_20	image	噪声图像
noise_last_10	image	噪声图像

标注类别

每个图像都带有二元标签，指示其是否属于以下类别：

violence（暴力）
sexual（性相关）
hate（仇恨）
illegal_activity（非法活动）
sensitive_ip（敏感知识产权）
safe（安全）

标签表示：

1 → 存在该类别内容
0 → 不存在该类别内容

预期用途

该数据集可用于：

评估视觉-语言模型的安全性
测试图像审核模型
对多模态安全分类器进行基准测试

局限性

该数据集规模相对较小，主要设计用于测试和评估，而非完整的模型训练。

许可证

请确保遵守任何底层图像来源的许可证和使用限制。

搜集汇总

数据集介绍

构建方式

在图像安全评估领域，Auditor_Test数据集的构建遵循了严谨的标注流程。该数据集通过精心收集450个图像样本，每幅图像均与对应的文本提示词配对，并由专业标注人员依据六类安全维度进行二元标注。标注类别涵盖暴力、色情、仇恨言论、非法活动、敏感知识产权及安全内容，每项标注以整型数值明确标识是否存在相应风险。数据集的构建聚焦于测试场景，专门设计用于评估模型在真实多模态环境下的安全分类性能，确保了评估基准的可靠性与针对性。

特点

Auditor_Test数据集展现出鲜明的专业评估特性。其核心特征在于提供了图像与文本提示的多模态配对数据，并附有精细化的安全标注矩阵，覆盖了从显性违规内容到隐性知识产权风险的多维度安全范畴。数据集规模紧凑而精炼，专注于测试集功能，避免了训练数据的冗余，从而为图像安全分类模型提供了高效、直接的评估框架。此外，数据集还包含了不同噪声水平的图像变体，为研究模型在干扰环境下的鲁棒性提供了额外维度。

使用方法

该数据集主要服务于图像安全分类模型的性能评测。使用者可通过Hugging Face的`datasets`库直接加载数据集，便捷地访问测试分割中的图像、提示词及多类别安全标签。研究人员可基于此数据集系统评估视觉-语言模型在内容安全过滤方面的效能，或将其作为基准测试平台，用于比较不同图像审核算法在识别暴力、色情、仇恨等有害内容上的准确性。鉴于其评估导向，该数据集适用于模型测试与验证阶段，而非大规模训练任务。

背景与挑战

背景概述

随着生成式人工智能技术的飞速发展，多模态模型，特别是文生图模型，在内容创作领域展现出巨大潜力，但同时也引发了关于生成内容安全性的广泛担忧。Auditor_Test数据集应运而生，旨在为图像安全分类模型的评估提供一个专门的基准测试集。该数据集由研究人员或机构构建，其核心研究问题聚焦于如何系统、准确地评估模型在识别图像中暴力、色情、仇恨、非法活动、敏感知识产权及安全内容等多维度风险上的性能。通过提供图像、对应生成提示词以及精细的二元安全标注，该数据集推动了多模态内容安全评估领域的标准化进程，对促进人工智能安全、可信发展具有重要影响力。

当前挑战

该数据集致力于解决多模态内容安全评估这一核心领域问题，其面临的挑战在于图像安全边界的模糊性与主观性。不同文化、法律背景对‘暴力’、‘仇恨’等概念的界定存在差异，为构建具有普适性和公正性的评估标准带来困难。在数据集构建过程中，挑战同样显著。首先，高质量安全标注依赖专业标注员，但标注过程易受主观判断影响，且涉及敏感内容可能对标注员造成心理负担。其次，为确保评估的全面性，需要收集涵盖各类安全风险的、具有代表性的图像样本，同时需妥善处理图像版权与隐私问题，这在实际操作中增加了数据获取与整理的复杂性。

常用场景

经典使用场景

在视觉语言模型安全评估领域，Auditor_Test数据集作为一项基准测试工具，主要用于评估图像安全分类模型的性能。该数据集通过提供带有提示词和多重安全标注的图像对，使研究者能够系统性地测试模型在识别暴力、色情、仇恨等有害内容方面的准确性与鲁棒性。其经典应用场景涉及对预训练多模态模型进行端到端的安全审计，确保模型在生成或理解图像时符合伦理规范。

衍生相关工作

基于Auditor_Test数据集，学术界衍生了一系列经典研究工作，例如开发针对多模态安全分类的对抗性测试框架，以及构建跨领域安全迁移学习模型。这些工作不仅扩展了数据集的评估维度，还催生了如安全感知的视觉提示工程、基于噪声注入的鲁棒性增强方法等创新方向，显著推动了图像安全评估技术的前沿进展。

数据集最近研究