five

MIBench|模型反转攻击数据集|人脸识别数据集

收藏
arXiv2024-10-08 更新2024-10-09 收录
模型反转攻击
人脸识别
下载链接:
https://arxiv.org/pdf/2410.05159v1
下载链接
链接失效反馈
资源简介:
MIBench是由哈尔滨工业大学(深圳)和清华大学共同创建的首个模型反转攻击和防御的综合基准。该数据集包含4个广泛认可的人脸数据集,包括Flickr-Faces-HQ (FFHQ)、MetFaces、FaceScrub和CelebFaces Attributes (CelebA)。这些数据集主要用于模型反转攻击的实验,支持低分辨率和高分辨率的图像处理。数据集的创建旨在为研究人员提供一个可扩展和可复现的工具箱,以标准化和公平地评估模型反转攻击和防御方法,从而推动该领域的进一步发展。
提供机构:
哈尔滨工业大学(深圳)计算机科学与技术学院, 清华大学深圳国际研究生院, 清华大学计算机科学与技术系
创建时间:
2024-10-08
AI搜集汇总
数据集介绍
main_image_url
构建方式
MIBench的构建旨在解决模型逆向攻击(Model Inversion, MI)领域中缺乏全面、一致且可靠基准的问题。该数据集通过将MI攻击和防御的流程分解为四个主要模块:数据预处理、攻击方法、防御策略和评估,从而构建了一个可扩展的模块化工具箱。目前,MIBench集成了16种最先进的攻击和防御方法,并配备了9种常用的评估协议,以确保标准化和公平的评估分析。
特点
MIBench的主要特点在于其模块化的设计,使得研究人员可以轻松地扩展和定制攻击与防御方法。此外,该数据集提供了多种分辨率版本的图像数据,以及丰富的数据预处理工具,极大地简化了研究者的实验准备过程。MIBench还包含了广泛的评估指标,涵盖了从分类准确性到样本多样性的多个维度,确保了对MI方法性能的全面评估。
使用方法
使用MIBench时,研究者可以通过其模块化的工具箱自由组合公共数据集和私有数据集,进行定制化的实验设置。数据预处理模块提供了自动化的数据分割和图像变换功能,而攻击和防御模块则允许用户选择和配置不同的攻击和防御策略。评估模块提供了多种评估指标,用户可以根据需要选择合适的指标来评估其方法的性能。此外,MIBench还提供了详细的实验设置和结果分析工具,帮助研究者更好地理解和比较不同方法的效果。
背景与挑战
背景概述
MIBench,作为首个针对模型逆向攻击与防御的综合基准,由哈尔滨工业大学深圳校区和清华大学的研究人员于2025年提出。该数据集旨在解决深度神经网络(DNNs)隐私威胁中模型逆向(MI)攻击的评估问题。MI攻击通过利用目标模型的输出信息重建隐私敏感的训练数据,引发了广泛关注。MIBench的推出填补了这一领域缺乏全面、一致和可靠基准的空白,为不同攻击方法的比较提供了标准化和公平的实验环境。该基准集成了16种最先进的攻击和防御方法,并提供了一套包含9种常用评估协议的工具,以促进对MI方法性能的全面评估。
当前挑战
MIBench在构建过程中面临多项挑战。首先,模型逆向攻击的快速发展使得缺乏统一的评估基准成为一个显著问题,导致新方法的评估往往局限于与少数先前工作的比较,限制了分析的广度和深度。其次,不同攻击方法在不同分辨率图像上的表现不一致,缺乏统一和全面的比较。此外,实验设置的不一致性和评估指标的差异进一步模糊了报告结论的可靠性。MIBench通过提供一个可扩展和可复现的模块化工具箱,旨在解决这些挑战,确保在MI领域的研究实践更加稳健和透明。
常用场景
经典使用场景
MIBench 数据集在模型反演攻击与防御领域中扮演着至关重要的角色。其经典使用场景主要集中在评估和比较不同模型反演攻击方法的有效性。通过集成16种最先进的攻击和防御方法,MIBench 提供了一个可扩展和可复现的模块化工具箱,使得研究人员能够在统一的环境中进行实验,从而确保实验结果的可比性和可靠性。此外,MIBench 还配备了一套包含9种常用评估协议的评估工具,进一步促进了标准化和公平的评估分析。
解决学术问题
MIBench 数据集解决了模型反演攻击领域中缺乏全面、一致和可靠基准的学术问题。这一数据集的引入填补了现有研究在攻击方法比较和实验设置一致性方面的空白,从而推动了该领域的系统性探索和理论基础的深入研究。通过提供一个统一的框架,MIBench 有助于准确测量模型反演攻击领域的进展,并揭示潜在的研究方向,为未来的研究提供了坚实的基础。
衍生相关工作
MIBench 数据集的推出催生了大量相关研究工作。例如,基于 MIBench 的研究人员开发了新的攻击方法,如利用生成对抗网络(GAN)进行更强大的图像先验重建。同时,也有研究致力于改进防御策略,如通过模型输出处理和鲁棒模型训练来增强模型的隐私保护能力。此外,MIBench 还激发了对模型预测能力、模型架构、可转移性和损失函数等因素在模型反演攻击中作用的研究,进一步推动了该领域的理论和实践发展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。

OpenDataLab 收录

Subway Dataset

该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。

www.kaggle.com 收录

rule34lol-images-part1

该数据集包含来自rule34.lol图像板的196,000个图像文件的元数据。元数据包括URL、标签、文件信息和点赞数。实际图像文件存储在zip存档中,每个存档包含1000个图像。该数据集是更大集合的一部分,分为Part 1和Part 2。数据集采用CC0许可,允许免费使用、修改和分发,无需署名。

huggingface 收录

典型分布式光伏出力预测数据集

光伏电站出力数据每5分钟从电站机房监控系统获取;气象实测数据从气象站获取,气象站建于电站30号箱变附近,每5分钟将采集的数据通过光纤传输到机房;数值天气预报数据利用中国电科院新能源气象应用机房的WRF业务系统(包括30TF计算刀片机、250TB并行存储)进行中尺度模式计算后输出预报产品,每日8点前通过反向隔离装置推送到电站内网预测系统。

国家基础学科公共科学数据中心 收录

中国区域教育数据库

该数据集包含了中国各区域的教育统计数据,涵盖了学校数量、学生人数、教师资源、教育经费等多个方面的信息。

www.moe.gov.cn 收录