MM-SafetyBench

Name: MM-SafetyBench
Creator: PKU-Alignment
Published: 2024-09-16 15:37:39
License: 暂无描述

Hugging Face2024-09-16 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/PKU-Alignment/MM-SafetyBench

下载链接

链接失效反馈

官方服务：

资源简介：

MM-SafetyBench数据集包含多个配置，每个配置专注于不同类型的潜在有害或敏感内容，如经济伤害、金融建议、欺诈、政府决策、仇恨言论、健康咨询、非法活动、法律意见、恶意软件生成、身体伤害、政治游说、隐私侵犯和性相关内容。每个配置包含'id'、'question'和'image'特征，并分为'test'集，具有指定的数据大小和示例数量。该数据集仅限非商业用途，适用于研究目的，并提醒用户注意内容的敏感性，需遵守相关伦理和法律指南。

提供机构：

PKU-Alignment

创建时间：

2024-09-14

原始信息汇总

MM-SafetyBench 数据集概述

基本信息

语言: 英语 (en)
许可证: CC BY NC 4.0 (仅限非商业使用)
数据集名称: MM-SafetyBench

数据集配置

配置列表

EconomicHarm
Financial_Advice
Fraud
Gov_Decision
HateSpeech
Health_Consultation
Illegal_Activitiy
Legal_Opinion
Malware_Generation
Physical_Harm
Political_Lobbying
Privacy_Violence
Sex

配置详情

EconomicHarm

特征:
- id: 字符串 (string)
- question: 字符串 (string)
- image: 图像 (image)
分割:
- test: 122 个样本, 17316511 字节

Financial_Advice

特征:
- id: 字符串 (string)
- question: 字符串 (string)
- image: 图像 (image)
分割:
- test: 167 个样本, 21274582 字节

Fraud

特征:
- id: 字符串 (string)
- question: 字符串 (string)
- image: 图像 (image)
分割:
- test: 154 个样本, 20219796 字节

Gov_Decision

特征:
- id: 字符串 (string)
- question: 字符串 (string)
- image: 图像 (image)
分割:
- test: 149 个样本, 19891951 字节

HateSpeech

特征:
- id: 字符串 (string)
- question: 字符串 (string)
- image: 图像 (image)
分割:
- test: 163 个样本, 22190160 字节

Health_Consultation

特征:
- id: 字符串 (string)
- question: 字符串 (string)
- image: 图像 (image)
分割:
- test: 109 个样本, 11346703 字节

Illegal_Activitiy

特征:
- id: 字符串 (string)
- question: 字符串 (string)
- image: 图像 (image)
分割:
- test: 97 个样本, 13323855 字节

Legal_Opinion

特征:
- id: 字符串 (string)
- question: 字符串 (string)
- image: 图像 (image)
分割:
- test: 130 个样本, 16863829 字节

Malware_Generation

特征:
- id: 字符串 (string)
- question: 字符串 (string)
- image: 图像 (image)
分割:
- test: 44 个样本, 6126444 字节

Physical_Harm

特征:
- id: 字符串 (string)
- question: 字符串 (string)
- image: 图像 (image)
分割:
- test: 144 个样本, 17806565 字节

Political_Lobbying

特征:
- id: 字符串 (string)
- question: 字符串 (string)
- image: 图像 (image)
分割:
- test: 153 个样本, 21164411 字节

Privacy_Violence

特征:
- id: 字符串 (string)
- question: 字符串 (string)
- image: 图像 (image)
分割:
- test: 139 个样本, 17074351 字节

Sex

特征:
- id: 字符串 (string)
- question: 字符串 (string)
- image: 图像 (image)
分割:
- test: 109 个样本, 14312546 字节

数据文件路径

EconomicHarm: data/EconomicHarm/test*
Financial_Advice: data/Financial_Advice/test*
Fraud: data/Fraud/test*
Gov_Decision: data/Gov_Decision/test*
HateSpeech: data/HateSpeech/test*
Health_Consultation: data/Health_Consultation/test*
Illegal_Activitiy: data/Illegal_Activitiy/test*
Legal_Opinion: data/Legal_Opinion/test*
Malware_Generation: data/Malware_Generation/test*
Physical_Harm: data/Physical_Harm/test*
Political_Lobbying: data/Political_Lobbying/test*
Privacy_Violence: data/Privacy_Violence/test*
Sex: data/Sex/test*

注意事项

该数据集可能包含敏感或有害内容，用户需谨慎处理，并确保使用符合相关伦理指南和法律要求。
数据集仅限研究使用，并遵循 CC BY NC 4.0 许可证（仅限非商业使用）。

搜集汇总

数据集介绍

构建方式

MM-SafetyBench数据集的构建基于多模态内容的安全评估需求，涵盖了经济损害、金融建议、欺诈、政府决策、仇恨言论、健康咨询、非法活动、法律意见、恶意软件生成、身体伤害、政治游说、隐私侵犯和性内容等多个领域。每个领域的数据通过文本和图像相结合的方式呈现，数据文件以Parquet格式存储，分为SD、SD_TYPO、TYPO和Text_only四种分割方式，确保数据的多样性和完整性。

特点

该数据集的特点在于其多模态性质，结合了文本和图像信息，能够全面评估模型在不同情境下的安全性和鲁棒性。每个配置（如EconomicHarm、Financial_Advice等）均包含多个分割，涵盖了标准数据、带拼写错误的数据以及纯文本数据，为研究提供了丰富的实验场景。此外，数据集规模较大，每个配置的样本数量从44到167不等，确保了数据的广泛性和代表性。

使用方法

MM-SafetyBench数据集主要用于多模态模型的安全性和鲁棒性评估。用户可以通过加载不同配置的Parquet文件，获取文本和图像数据，并结合具体的研究目标进行实验。使用时应特别注意数据中可能包含的敏感或有害内容，确保研究符合伦理和法律要求。数据集仅限非商业用途，使用时需遵循CC BY NC 4.0许可协议。

背景与挑战

背景概述

MM-SafetyBench数据集是一个多模态安全评估基准，旨在通过结合文本和图像数据来评估模型在多种敏感和潜在有害场景下的表现。该数据集由研究人员和机构共同创建，涵盖了经济损害、金融建议、欺诈、政府决策、仇恨言论、健康咨询、非法活动、法律意见、恶意软件生成、身体伤害、政治游说、隐私侵犯和性内容等多个领域。其核心研究问题在于如何有效评估模型在这些复杂且敏感情境下的安全性和鲁棒性。该数据集的发布为相关领域的研究提供了重要的基准工具，推动了多模态模型在安全性和伦理方面的研究进展。

当前挑战

MM-SafetyBench数据集面临的挑战主要体现在两个方面。首先，该数据集旨在解决多模态模型在敏感和有害场景下的评估问题，这些场景往往涉及复杂的伦理和法律问题，如何确保模型在这些情境下的安全性和合规性是一个巨大的挑战。其次，在数据集的构建过程中，研究人员需要处理大量敏感内容，确保数据的多样性和代表性，同时避免引入偏见或不当内容。此外，数据集的标注和验证过程也面临较高的技术要求，尤其是在多模态数据的对齐和一致性方面，确保文本和图像的关联性是一个复杂且耗时的任务。

常用场景

经典使用场景

MM-SafetyBench数据集在多模态安全评估领域具有重要应用，尤其在涉及图像和文本结合的敏感内容检测中表现突出。该数据集通过提供丰富的图像和文本对，帮助研究人员评估和优化模型在处理经济伤害、金融建议、欺诈等敏感话题时的表现。其经典使用场景包括多模态模型的鲁棒性测试、敏感内容过滤算法的开发与验证，以及跨模态信息融合技术的改进。

衍生相关工作

MM-SafetyBench数据集催生了一系列相关研究工作，特别是在多模态模型的安全性和鲁棒性评估方面。基于该数据集的研究成果包括多模态敏感内容检测算法的优化、跨模态信息融合技术的改进，以及针对特定领域（如金融、医疗）的定制化安全评估框架。这些工作不仅推动了多模态安全领域的技术进步，还为相关行业提供了实用的解决方案。

数据集最近研究