NTIRE 2026 Robust AI-Generated Image Detection in the Wild Dataset
收藏NTIRE 2026 野外鲁棒AI生成图像检测数据集概述
数据集背景
本数据集为NTIRE 2026挑战赛“野外鲁棒AI生成图像检测”所构建。旨在解决文本到图像(T2I)模型生成的合成图像与真实照片难以区分所带来的信任、真实性、取证和内容安全问题。数据集特别引入了“野外”风格变换,以评估检测方法在图像经过后处理(如裁剪、调整大小、压缩、模糊)和分布变化时的准确性、鲁棒性以及对未见生成器的泛化能力。
数据划分与规模
| 划分 | 图像数量 | 真实/生成图像比例 | 是否提供标签 | 生成器模型数量 | 变换类型数量 |
|---|---|---|---|---|---|
| 训练集 | ~277,000 | ~1:1.77 | 是 | 20 | 12 |
| 验证集 | 10,000 | 1:1 | 否 | 9 | 19 |
| 验证集(困难部分) | 2,500 | 1:1 | 否 | 7 | 19 |
| 测试集(公开) | 2,500 | 1:1 | 否 | 10 | 22 |
| 测试集(私有) | 2,500 | ~1:1 | 否 | 10 | 24 |
数据内容详情
生成器模型
- 训练集模型(20个):YOSO PixArt-512, PixArt-α, PixArt-Σ, Kandinsky 2, Kandinsky 3, Kolors, OmniGen, OmniGen 2, Stable Diffusion 1.4, Stable Diffusion 1.5, Stable Diffusion 2.1, Stable Diffusion XL 1.0, SDXL Lightning, SDXL Turbo, Janus Pro 7B, Infinity 2B, Infinity 8B, Ovis Image, DeepFloyd IF, FLUX.1 Kontext Dev。
- 验证集模型(9个):FLUX.1 Kontext Dev, SDXL Turbo, FLUX.1 Dev, Playground v2.5, Lumina Image 2.0, Qwen Image, Stable Diffusion 3 Medium, Ideogram v3 Turbo†, ImageGen-4 Fast†。
- 验证集(困难部分)模型(7个):Playground v2.5, SDXL Turbo, HiDream, FLUX.1 Schnell, Stable Diffusion 3.5 Large Turbo, Nano Banana†, Seedream 4†。
- 测试集(公开)模型(10个):HiDream, FLUX.1 Schnell, Stable Diffusion 3.5 Large, FLUX Krea, Z-Image Turbo, Nano Banana Pro†, FLUX-2 Max†, ImageGen-4 Ultra†, Seedream 5 Lite†, Groq Imagine Image†。
- 测试集(私有)模型(10个):HiDream, Stable Diffusion 3.5 Large Turbo, FLUX.1 Dev SRPO, Z-Image Turbo, Kandinsky 5, Nano Banana 2†, GPT Image 1.5†, ImageGen-4 Ultra†, Seedream 5 Lite†, Groq Imagine Image†。 (注:标记†的为专有模型)
图像变换类型
- 训练集变换(12种):高斯模糊、镜头模糊、色彩偏移、色彩饱和度、JPEG压缩、白噪声、脉冲噪声、亮度增加、亮度降低、色彩抖动、色彩量化、线性对比度变化。
- 验证集变换(19种):包含训练集的12种,并增加运动模糊、乘性噪声、像素化、RGB通道偏移、随机裁剪、随机纵横比裁剪、下采样。
- 验证集(困难部分)变换(19种):高斯模糊、镜头模糊、JPEG压缩、白噪声、脉冲噪声、色彩量化、乘性噪声、RGB通道偏移、随机裁剪、随机纵横比裁剪、神经图像压缩(JPEG AI)、随机色调曲线、CLAHE、ISO噪声、透视变换、多重压缩(JPEG)、多重压缩(JPEG + JPEG AI)、水印攻击(Adv. Embedding, CLIP/ResNet)、下采样。
- 测试集(公开)变换(22种):色彩饱和度、亮度增加、镜头模糊、JPEG压缩、脉冲噪声、RGB通道偏移、随机裁剪、随机纵横比裁剪、神经图像压缩(JPEG AI)、随机色调曲线、CLAHE、ISO噪声、透视变换、多重压缩(JPEG)、多重压缩(JPEG + JPEG AI)、水印攻击(Adv. Embedding, CLIP/ResNet)、JPEG 2000、水印攻击(WMForger)、神经图像压缩(Cheng2020)、散粒噪声、下采样、不可见水印插入(6种算法之一)。
- 测试集(私有)变换(24种):在公开测试集变换基础上,增加多重压缩(JPEG + JPEG 2000)、玻璃模糊,并将不可见水印插入算法增至7种。
数据集结构与获取
训练集
- 包含约277,000张图像,分为6个分片(每个约50,000张,最后一个除外)。
- 结构:每个分片目录包含
images/文件夹(存放*image_name*.jpg文件)和一个labels.csv文件(映射图像名与标签,0为真实图像,1为生成图像)。 - 下载地址:
- https://calypso.gml-team.ru:5001/sharing/oLxhMpcLY
- https://huggingface.co/datasets/deepfakesMSU/NTIRE-RobustAIGenDetection-train
验证集
- 包含10,000张图像(5,000张干净,5,000张失真),不提供标签。
- 困难部分包含2,500张图像,更接近测试集分布。
- 下载地址:https://huggingface.co/datasets/deepfakesMSU/NTIRE-RobustAIGenDetection-val
测试集(公开)
- 包含2,500张图像(1,250张干净,1,250张失真),不提供标签。
- 下载地址:https://huggingface.co/datasets/deepfakesMSU/NTIRE-RobustAIGenDetection-test
辅助数据
- 变换脚本:基础失真流程脚本可从 https://drive.google.com/file/d/1oGr--PUOd11xy0ayYB6p2Mgg67n6eJPc/view?usp=sharing 获取。
- 玩具数据集:用于帮助参与者熟悉数据结构和提交格式,不反映训练数据分布。下载地址:https://drive.google.com/file/d/1d5m9tBDaiZ6rYuv7ZnR139D4eQPSfwYR/view?usp=drive_link
评估指标
- 主要指标:鲁棒ROC AUC。在所有图像经过变换后,使用标签(0/1)和提交的分数计算单个ROC AUC,用于衡量检测器在不同阈值下的全局判别能力以及对后处理的鲁棒性。
- 次要指标:干净ROC AUC。在所有图像未经过变换的情况下,使用标签(0/1)和提交的分数计算单个ROC AUC,用于衡量检测器在不同阈值下的全局判别能力,不评估对后处理的鲁棒性。
组织方
- 莫斯科国立大学(MSU)
- 维尔茨堡大学(德国)
- 深圳北理莫斯科大学(SMBU)
- 主要联系人:Aleksandr Gushchin (alexanterg@gmail.com)
引用
若使用本数据集,请引用以下论文:
@inproceedings{ntire26aigendet, title={{ NTIRE 2026 Challenge on Robust AI-Generated Image Detection in the Wild }}, author={ Gushchin, Aleksandr and Abud, Khaled and Shumitskaya, Ekaterina and Filippov, Artem and Bychkov, Georgii and Lavrushkin, Sergey and Erofeev, Mikhail and Antsiferova, Anastasia and Chen, Changsheng and Tan, Shunquan and Timofte, Radu and Vatolin, Dmitriy and others }, booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) Workshops}, year = {2026} }




