BR-Gen

Name: BR-Gen
Creator: 中国教育部多媒体可信感知与高效计算重点实验室，厦门大学
Published: 2025-04-21 15:27:30
License: 暂无描述

arXiv2025-04-21 更新2025-04-23 收录

下载链接：

https://github.com/clpbc/BRGen

下载链接

链接失效反馈

官方服务：

资源简介：

BR-Gen是一个大规模、高质量的图像数据集，包含150,000张经过局部篡改的图像，涵盖了多样化的场景感知注释。该数据集由教育部多媒体可信感知与高效计算重点实验室（厦门大学）构建，通过全自动的感知-创建-评估管道，确保了图像的语义完整性和视觉真实性。数据集针对以往数据集中忽视的‘事物’和‘背景’类别，如天空、地面、墙壁、草地和植被等，拓宽了局部篡改图像的范畴。

BR-Gen is a large-scale, high-quality image dataset containing 150,000 locally tampered images with diverse scene-aware annotations. It was constructed by the Key Laboratory of Multimedia Trusted Perception and Efficient Computing, Ministry of Education, Xiamen University. A fully automatic perception-creation-evaluation pipeline is adopted to ensure the semantic integrity and visual authenticity of the images. Moreover, this dataset expands the scope of locally tampered images by covering the 'object' and 'background' categories that were neglected in previous datasets, such as sky, ground, wall, grassland and vegetation.

提供机构：

中国教育部多媒体可信感知与高效计算重点实验室，厦门大学

创建时间：

2025-04-16

搜集汇总

数据集介绍

构建方式

BR-Gen数据集通过全自动的Perception-Creation-Evaluation流程构建，确保了语义连贯性和视觉真实感。该流程首先利用GroundingDINO和SAM2模型定位并生成伪造区域掩码，随后采用Qwen2.5-VL模型进行语义理解与引导提示生成。在创建阶段，结合传统GAN和基于扩散模型的修复方法，生成多样化的局部伪造图像。最后通过多阶段感知评估指标（如BRISQUE、DreamSim和CLIP分数）严格筛选高质量样本，确保数据集的可靠性和多样性。

特点

BR-Gen数据集包含15万张局部伪造图像，覆盖了传统数据集中被忽视的“stuff”和“background”类别（如天空、地面、植被等），显著扩展了局部伪造的语义范围。其独特之处在于通过语义校准和概率语义扰动技术，实现了高质量的样本生成，同时避免了对象级伪造的偏差。此外，数据集通过多源图像（ImageNet、COCO、Places）和多种修复方法的结合，提供了更接近真实编辑场景的复杂样本。

使用方法

BR-Gen数据集适用于训练和评估局部AI生成图像检测模型。用户可按照标准8:1:1的比例划分训练集、验证集和测试集，确保数据分布的均衡性。数据集配套的NFA-ViT模型通过噪声引导的注意力机制，可有效放大伪造特征，提升对小尺度或空间分散伪造的检测鲁棒性。研究者还可利用其丰富的区域注释和生成方法标签，进行跨架构（GAN与扩散模型）和跨类别（对象与场景）的泛化性分析。

背景与挑战

背景概述

BR-Gen数据集由厦门大学可信多媒体感知与高效计算教育部重点实验室联合腾讯优图实验室等机构于2025年提出，旨在解决AI生成图像局部篡改检测领域的核心问题。该数据集包含15万张经过语义校准的局部篡改图像，覆盖传统方法忽视的'stuff'（如天空、草地）和'background'（结构性背景）类别，通过全自动的感知-生成-评估流程确保语义连贯性与视觉真实感。作为首个大规模场景感知的局部篡改基准，BR-Gen推动了从对象级到场景级篡改检测的范式转变，为数字内容真实性认证提供了更全面的评估体系。

当前挑战

BR-Gen数据集面临双重挑战：在领域问题层面，需解决现有方法对复杂场景元素（如分布式篡改、非显著区域编辑）检测性能骤降的问题，传统模型在'stuff'类别的检测准确率较对象级篡改平均下降42.6%；在构建层面，需克服语义一致性保持（跨150个语义类别）、视觉伪影消除（边界接缝、纹理不连续）以及多模态对齐（文本引导编辑与视觉合理性校验）三大技术难点，最终通过三重评估机制（结构完整性、图像相似度、语义对齐）实现仅8.7%的样本淘汰率。

常用场景

经典使用场景

在计算机视觉领域，BR-Gen数据集为AI生成图像的局部伪造检测提供了全新的研究场景。该数据集特别关注传统方法难以处理的复杂场景元素，如天空、地面等背景区域的编辑，填补了现有数据集中对象级伪造与全图生成之间的空白。通过其精心设计的感知-创造-评估流程，BR-Gen生成了15万张具有语义一致性和视觉真实性的局部伪造图像，为研究者提供了评估模型在多样化伪造场景下性能的标准化基准。

衍生相关工作

基于BR-Gen数据集，研究者提出了NFA-ViT这一创新性检测框架，通过噪声引导的注意力机制放大伪造特征。该工作启发了后续多项研究，包括改进的噪声提取方法、跨模态注意力机制在伪造检测中的应用等。同时，数据集揭示的模型在'stuff'和'background'类别上性能差异现象，推动了针对场景元素特性的专用检测算法开发，形成了一系列相关研究工作。

数据集最近研究