RealChain
收藏数据集概述
数据集基本信息
- 数据集名称: RealChain
- 核心用途: 用于在真实世界条件下(特别是模拟社交媒体传播的链式退化)评估AI生成图像(AIGI)检测方法的综合性基准。
- 发布地址: https://huggingface.co/datasets/handsomerich/RealChain
- 关联研究: Beyond Artifacts: Real-Centric Envelope Modeling for Reliable AI-Generated Image Detection
- 论文链接: https://arxiv.org/abs/2512.20937
- 许可协议: 数据集采用 CC BY-NC 4.0 许可。
数据构成与规模
数据集包含真实图像和由7种最先进的生成器合成的图像。
源图像类别与数量
| 类别 | 来源/生成器 | 类型 | 图像数量 |
|---|---|---|---|
| Real | MSCOCO, OpenImage-v7, Unsplash, ImageNet | 真实图像 | 7,000 |
| Flux.1 | Flux.1 | 开源文本生成图像 | 1,000 |
| SDv3.5 | Stable Diffusion v3.5 | 开源文本生成图像 | 1,000 |
| QwenImage | QwenImage | 开源文本生成图像 | 1,000 |
| Hunyuan 3.0 | Hunyuan 3.0 | 商业文本生成图像 | 1,000 |
| NanoBanana | NanoBanana | 商业文本生成图像 | 1,000 |
| Seedream 4.0 | Seedream 4.0 | 商业文本生成图像 | 1,000 |
| i2i | Seedream 4.0 | 商业图像生成图像 | 1,000 |
总计: 15,000 张图像。
退化处理
为模拟真实社交媒体传播,每张图像都经过随机构建的退化链处理。
- 退化链长度: 2 到 5 步。
- 退化类型:
- 传播: 模拟跨平台上传/下载(如 WeChat, TikTok, Baidu, Instagram, X)。
- 后处理: 模拟用户编辑(如 Filter, Sticker, Crop/Resize, Screenshot)。
- 退化链数量: 50 种独特的定义。
- 数据版本: 每个源图像提供**无退化(ND)和链式退化(CD)**两个版本。
数据集结构
RealChain/ ├── Real/ # 7,000 张真实图像 ├── Flux1/ # 1,000 张 Flux.1 生成图像 ├── SDv3.5/ # 1,000 张 SD v3.5 生成图像 ├── QwenImage/ # 1,000 张 QwenImage 生成图像 ├── Hunyuan3/ # 1,000 张 Hunyuan 3.0 生成图像 ├── NanoBanana/ # 1,000 张 NanoBanana 生成图像 ├── Seedream4/ # 1,000 张 Seedream 4.0 (文本生成图像) ├── i2i/ # 1,000 张 Seedream 4.0 (图像生成图像) └── degradation_chains.json # 50 种链式退化的定义文件
下载方式
bash git lfs install git clone https://huggingface.co/datasets/handsomerich/RealChain
设计目标与特点
- 真实性: 通过包含多种商业和开源生成器以及复杂的链式退化,忠实复现真实的社交媒体环境。
- 全面性: 涵盖广泛的图像来源和生成技术,用于评估检测方法的泛化能力和鲁棒性。
- 挑战性: 链式退化会引入JPEG伪影、分辨率损失、贴纸和颜色偏移等,严重挑战现有检测器。
关联方法简介
数据集为支持论文《Beyond Artifacts: Real-Centric Envelope Modeling for Reliable AI-Generated Image Detection》而构建。该论文提出了REM方法,其核心是:
- 新范式: 对真实图像分布边界进行建模,而非学习生成器特定的伪影。
- 关键模块: 包括流形边界重建(MBR)、包络估计器(EE)和跨域一致性(CDC)。
- 宣称优势: 对未见过的生成器具有泛化能力,并在严重退化下保持鲁棒性。
数据来源致谢
- 真实图像: 源自 MSCOCO、OpenImage-v7、Unsplash 和 ImageNet。
- 合成图像: 使用开源模型(Flux.1、SDv3.5、QwenImage)和商业API(Hunyuan 3.0、NanoBanana、Seedream 4.0)生成。




