W-Bench|水印技术数据集|图像编辑数据集
收藏Robust Watermarking Using Generative Priors Against Image Editing: From Benchmarking to Advances
数据集概述
- 标题: Robust Watermarking Using Generative Priors Against Image Editing: From Benchmarking to Advances
- 作者: Shilin Lu, Zihan Zhou, Jiayou Lu, Yuanzhi Zhu, Adams Wai-Kin Kong
- 摘要: 当前的图像水印方法在面对大规模文本到图像模型启用的先进图像编辑技术时显得脆弱。这些模型在编辑过程中可能会扭曲嵌入的水印,对版权保护构成重大挑战。本文介绍了W-Bench,这是第一个全面评估水印方法对各种图像编辑技术(包括图像再生、全局编辑、局部编辑和图像到视频生成)的鲁棒性的基准。通过对十一种代表性水印方法在常见编辑技术下的广泛评估,我们发现大多数方法在编辑后无法检测到水印。为了解决这一局限性,我们提出了VINE,一种显著增强对各种图像编辑技术鲁棒性的水印方法,同时保持高图像质量。我们的方法涉及两个关键创新:(1)我们分析了图像编辑的频率特性,并发现模糊失真具有相似的频率特性,这使我们能够在训练期间使用它们作为代理攻击来增强水印鲁棒性;(2)我们利用大规模预训练的扩散模型SDXL-Turbo,将其适应于水印任务,以实现更不可察觉和鲁棒的水印嵌入。实验结果表明,我们的方法在各种图像编辑技术下实现了出色的水印性能,在图像质量和鲁棒性方面均优于现有方法。
内容
- 环境设置:
- 创建Conda环境
- 下载VINE检查点
- 推理:
- 水印编码
- 图像编辑
- 水印解码
- 质量指标计算
- 演示
- W-Bench: 即将推出
- 引用: 如果发现该仓库有用,请考虑引用
环境设置
创建Conda环境
git clone https://github.com/Shilin-LU/VINE.git conda env create -f environment.yaml conda activate vine cd diffusers pip install -e .
下载VINE检查点
模型VINE-B和VINE-R已发布,可在此处下载,并放置在./ckpt
文件夹中。
推理
水印编码
使用以下命令将消息编码到图像中:
python src/watermark_encoding.py --ckpt_path ./ckpt/VINE-R
--input_path ./example/input/2.png
--output_dir ./example/watermarked_img
--message Hello World!
图像编辑
提供UltraEdit和图像反演进行图像编辑,更多选项即将添加。使用以下命令编辑图像:
python src/image_editing.py --model ultraedit
--input_path ./example/watermarked_img/2_wm.png
--output_dir ./example/edited_watermarked_img
水印解码
使用以下命令从已编辑的水印图像中解码消息:
python src/watermark_decoding.py --ckpt_path ./ckpt/VINE-R
--input_path ./example/edited_watermarked_img/2_wm_edit.png
--groundtruth_message Hello World!
质量指标计算
使用以下命令计算单张图像的质量指标(PSNR、SSIM和LPIPS):
python src/quality_metrics.py --input_path ./example/input/2.png --wmed_input_path ./example/watermarked_img/2_wm.png
演示
提供一个完整的演示,包括水印编码、图像编辑、水印解码和质量指标计算的过程,请参考./src/demo.ipynb
获取详细说明。
W-Bench
即将推出
引用
如果发现该仓库有用,请考虑引用。

- 1Robust Watermarking Using Generative Priors Against Image Editing: From Benchmarking to Advances南洋理工大学 · 2024年
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
IVLLab/MultiDialog
该数据集包含手动注释的元数据,将音频文件与转录、情感和其他属性链接起来。数据集支持多种任务,包括多模态对话生成、自动语音识别和文本到语音转换。数据集的语言为英语,并提供了一个黄金情感对话子集,用于研究对话中的情感动态。数据集的结构包括音频文件、对话ID、话语ID、来源、音频特征、转录文本、情感标签和原始路径等信息。
hugging_face 收录
Hang Seng Index
恒生指数(Hang Seng Index)是香港股市的主要股票市场指数,由恒生银行旗下的恒生指数有限公司编制。该指数涵盖了香港股票市场中最具代表性的50家上市公司,反映了香港股市的整体表现。
www.hsi.com.hk 收录
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
CHARLS
中国健康与养老追踪调查(CHARLS)数据集,旨在收集反映中国45岁及以上中老年人家庭和个人的高质量微观数据,用以分析人口老龄化问题,内容包括健康状况、经济状况、家庭结构和社会支持等。
charls.pku.edu.cn 收录