ARForensics

Name: ARForensics
Creator: 清华大学自动化系, 清华大学电子工程系
Published: 2025-10-07 21:02:27
License: 暂无描述

arXiv2025-10-07 更新2025-10-09 收录

下载链接：

https://github.com/Zhangyr2022/D3QE

下载链接

链接失效反馈

官方服务：

资源简介：

ARForensics数据集由清华大学自动化系和电子工程系的研究人员创建，用于检测自回归生成的图像。该数据集涵盖了当前表现最优秀的7种主流视觉自回归模型。数据集的大小和Tokens数未在论文中明确提及。数据集的创建过程是将真实图像与自回归模型生成的图像进行对比，分析它们在离散特征上的差异。该数据集的应用领域是图像生成检测，旨在解决自回归模型生成的图像难以与真实图像区分的问题。

The ARForensics dataset was developed by researchers from the Department of Automation and Department of Electronic Engineering at Tsinghua University, for the task of detecting autoregressively generated images. It covers 7 state-of-the-art mainstream visual autoregressive models. Neither the dataset size nor the token count is explicitly stated in the associated research paper. The dataset is constructed by contrasting real images with images generated by autoregressive models to analyze their discrepancies in discrete features. Its application domain is image generation detection, which aims to address the challenge that images generated by autoregressive models are difficult to distinguish from real ones.

提供机构：

清华大学自动化系, 清华大学电子工程系

创建时间：

2025-10-07

原始信息汇总

ARForensics 数据集概述

数据集基本信息

数据集名称: ARForensics
用途: 视觉自回归生成图像检测基准数据集
创建者: Yanran Zhang, Bingyao Yu, Yu Zheng, Wenzhao Zheng, Yueqi Duan, Lei Chen, Jie Zhou, Jiwen Lu
关联论文: D³QE: Learning Discrete Distribution Discrepancy-aware Quantization Error for Autoregressive-Generated Image Detection (ICCV 2025)

数据集特点

首个大规模专门用于视觉自回归模型检测的数据集
包含7种自回归模型: LlamaGen, VAR, Infinity, Janus-Pro, RAR, Switti, Open-MAGVIT2
多样化架构: 涵盖不同token/scale架构

数据划分

训练集: 10万张LlamaGen图像 + 10万张ImageNet图像
验证集: 1万张LlamaGen图像 + 1万张ImageNet图像
测试集: 平衡测试集，每个模型6千个样本

数据集结构

ARForensics/ ├─ train/ │ ├─ 0_real/ │ └─ 1_fake/ ├─ val/ │ ├─ 0_real/ │ └─ 1_fake/ └─ test/ ├─ Infinity/ │ ├─ 0_real/ │ └─ 1_fake/ ├─ Janus_Pro/ ├─ RAR/ ├─ Switti/ ├─ VAR/ ├─ LlamaGen/ └─ Open_MAGVIT2/

获取方式

HuggingFace: https://huggingface.co/datasets/Yanran21/ARForensics
ModelScope: https://www.modelscope.cn/datasets/YanranZhang/ARForensics

搜集汇总

数据集介绍

构建方式

在自回归视觉模型快速发展的背景下，ARForensics数据集通过系统整合七种主流自回归生成模型构建而成。该数据集选取LlamaGen、VAR、Infinity等代表性模型，涵盖基于令牌和基于尺度的不同架构，确保技术多样性。真实样本源自ImageNet数据集，生成样本则通过文本到图像合成与类别条件生成两种方式获得，共计包含30.4万张图像，并划分为训练集、验证集和测试集以支持模型评估。

特点

该数据集显著特点在于其全面覆盖自回归模型的离散化生成特性。不同模型在码本容量与量化策略上存在显著差异，导致生成图像在码本令牌分布上呈现独特统计模式。数据集通过平衡采样策略避免传统数据集的样本偏差问题，同时包含跨范式测试集以验证检测方法的泛化能力。这种设计使数据集能够有效捕捉自回归模型在离散潜在空间中的特征表达。

使用方法

该数据集适用于开发与评估针对自回归生成图像的检测算法。研究人员可利用训练集学习模型在离散量化过程中的统计特征，通过验证集调整超参数，并在包含多种自回归模型的测试集上评估泛化性能。跨范式测试集进一步支持检测方法在GAN与扩散模型上的迁移能力验证，为研究社区提供全面的基准测试平台。

背景与挑战

背景概述

随着视觉自回归模型在图像生成领域的崛起，ARForensics数据集应运而生，由清华大学研究团队于2025年构建。该数据集聚焦于解决自回归生成图像检测这一新兴课题，涵盖LlamaGen、VAR、Infinity等七种主流视觉自回归模型生成的30余万张图像。通过系统整合ImageNet真实图像与多模态生成样本，该数据集为探索自回归模型特有的离散编码特征提供了重要实验平台，推动了生成式人工智能安全检测技术的发展。

当前挑战

自回归生成图像检测面临双重挑战：在领域问题层面，传统基于高频伪影或噪声模式的检测方法难以捕捉自回归模型在离散隐空间中表现的分布特征，其代码本使用模式的长尾分布与生成样本的概率集中现象形成显著对比；在构建过程中，需平衡七种异构自回归架构的生成策略差异，同时确保真实图像与生成样本在语义一致性和视觉合理性上的严格对齐，这对数据集的规模扩展与质量验证提出了更高要求。

常用场景

经典使用场景

在计算机视觉领域，ARForensics数据集作为首个专注于自回归生成图像检测的基准，其经典应用场景在于系统评估各类检测算法对主流视觉自回归模型的泛化能力。该数据集通过整合LlamaGen、VAR、Infinity等七种代表性自回归架构，构建了涵盖不同离散化策略与分辨率规模的测试环境，为探索自回归生成图像在离散潜在空间中的统计特征提供了标准化实验平台。

实际应用

在实际应用层面，ARForensics支撑的检测技术已延伸至数字媒体取证与信息安全保障领域。基于该数据集训练的模型能够有效识别由自回归模型生成的虚假新闻图像、伪造艺术品及合成身份凭证，为社交媒体平台内容审核、司法电子证据鉴定提供了技术支撑。其对抗JPEG压缩与中心裁剪等现实扰动的鲁棒性特性，进一步确保了在复杂网络环境下的部署可行性。

衍生相关工作

该数据集的发布催生了多项创新性研究，其中最具代表性的是D3QE框架及其衍生的离散分布感知Transformer架构。后续研究在此基础上发展了多模态码本对齐方法，将频率统计先验与语义特征融合机制扩展至视频生成检测领域。同时启发了对跨范式生成模型统一检测理论的探索，促使研究者从离散化本质出发构建更具普适性的深度伪造防御体系。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集