Mirage-Test

Hugging Face2025-12-02 更新2025-12-03 收录

下载链接：

https://huggingface.co/datasets/Yunncheng/Mirage-Test

下载链接

链接失效反馈

官方服务：

资源简介：

Mirage-Test是一个现代的仅用于测试的数据集，用于基准测试AI生成图像检测模型。它包含真实的和伪造的图片，跨越五个不同的内容领域，旨在评估在不同视觉语义之间的一般化能力。伪造的图片是使用专门优化感知真实性和视觉保真度的最先进的生成模型生成的。此数据集仅用于评估，未提供训练分割。

创建时间：

2025-12-02

原始信息汇总

Mirage-Test 数据集概述

基本信息

数据集名称: Mirage-Test
许可协议: MIT
主要标签: AI生成图像、AI生成图像检测、测试集、深度伪造、伪造检测、计算机视觉
任务类别: 图像分类
语言: 英文

数据集描述

Mirage-Test 是一个现代的、仅用于测试的数据集，旨在为AI生成图像检测模型提供基准测试。它包含跨越五个不同内容领域的真实图像和伪造图像，用于评估模型在多样化视觉语义上的泛化能力。伪造图像使用专门为感知真实性和视觉保真度优化的先进生成模型创建。

该数据集仅用于评估，不提供训练集。

数据集结构

数据组织

图像按内容类型和真实性分层组织：

Animal/: 动物图像
- 0_real/: 真实动物照片
- 1_fake/: AI生成的动物图像
Anime/: 动漫图像
- 1_fake/: AI生成的动漫风格图像
Human/: 人物图像
- 0_real/: 真实人物照片
- 1_fake/: AI生成的人物图像
Object/: 物体图像
- 0_real/: 真实物体照片
- 1_fake/: AI生成的物体图像
Scene/: 场景图像
- 0_real/: 真实景观/建筑照片
- 1_fake/: AI生成的场景图像

数据特征

总样本数: 49000
特征字段:
- image: 图像文件（PNG/JPG），原始分辨率。
- is_real: 字符串类型，表示图像真实性。
- content_type: 字符串类型，表示内容类型。
数据文件: metadata.parquet

下载与使用

下载原始文件

要下载具有原始文件夹结构的数据集，可使用以下Python代码： python from huggingface_hub import snapshot_download

snapshot_download( repo_id="Yunncheng/Mirage-Test", repo_type="dataset", local_dir="./Mirage-Test" )

致谢

伪造图像使用先进的扩散模型生成（例如，Stable Diffusion、FLUX）。
真实图像来源于公开可用的、免版税的图像平台（例如，Pexels）。

引用

如果此工作对您的研究有帮助，请引用我们的论文： bibtex @article{guo2025omniaid, title={OmniAID: Decoupling Semantic and Artifacts for Universal AI-Generated Image Detection in the Wild}, author={Guo, Yuncheng and Ye, Junyan and Zhang, Chenjue and Kang, Hengrui and Fu, Haohuan and He, Conghui and Li, Weijia}, journal={arXiv preprint arXiv:2511.08423}, year={2025} }

搜集汇总

数据集介绍

构建方式

在人工智能生成图像检测领域，Mirage-Test数据集作为一项专注于评估的基准工具，其构建过程体现了严谨的科学方法。该数据集包含总计49,000个样本，通过系统性地整合真实图像与合成图像而形成。真实图像来源于Pexels等公开的免版税图像平台，确保了内容的合法性与多样性。合成图像则采用了Stable Diffusion、FLUX等前沿的扩散模型生成，这些模型经过专门优化，旨在追求卓越的感知真实感与视觉保真度。数据组织采用层级结构，依据动物、动漫、人物、物体、场景这五个内容领域以及图像的真实性进行分类，为评估模型在不同语义范畴下的泛化能力奠定了结构化基础。

特点

Mirage-Test数据集的核心特征在于其专为测试而设计的纯粹性，不包含训练集，这使其成为评估模型泛化性能的理想基准。数据集涵盖了五个差异显著的内容领域，包括动物、动漫、人物、物体和场景，这种多样性能够全面检验检测模型面对复杂视觉语义时的鲁棒性。所有合成图像均利用当前最先进的生成模型制作，在细节呈现和整体观感上均达到了极高的仿真水准，从而对检测算法构成了实质性挑战。其清晰的层级目录结构和配套的元数据文件，也为研究人员进行系统性的实验分析与结果复现提供了极大便利。

使用方法

对于希望利用该数据集的研究者而言，其使用方法直接而高效。数据集可通过Hugging Face Hub提供的`snapshot_download`接口便捷下载，能够完整保留原始的文件夹层级结构。用户下载后，可依据图像路径和元数据中标注的`is_real`与`content_type`字段，轻松构建测试流程。该数据集主要用于对已训练好的AI生成图像检测模型进行性能评估，通过计算模型在五个不同内容领域上对真实与合成图像的分类准确率等指标，可以客观衡量模型在开放环境下的实际检测能力与跨领域泛化水平。

背景与挑战

背景概述

随着生成式人工智能技术的迅猛发展，特别是扩散模型在图像合成领域的广泛应用，AI生成图像的视觉保真度已达到以假乱真的水平。这一进步在催生创意应用的同时，也带来了严峻的深度伪造与内容真实性鉴别的挑战。在此背景下，由研究人员Yunncheng等人于2025年构建的Mirage-Test数据集应运而生，其核心研究目标是提供一个专门用于评估AI生成图像检测模型泛化能力的基准测试集。该数据集聚焦于解耦图像语义与生成痕迹，旨在推动通用检测算法的发展，对计算机视觉领域的内容安全与媒体取证研究具有重要的推动作用。

当前挑战

该数据集旨在解决的领域核心挑战是通用AI生成图像检测，即要求模型能够跨越不同内容语义域（如人像、动物、场景等），精准识别出由多种前沿生成模型合成的图像，这对模型的泛化性与鲁棒性提出了极高要求。在构建过程中，挑战主要集中于如何系统性地收集与生成涵盖五大内容域的高质量真实与伪造图像对，并确保伪造图像在感知真实性与视觉逼真度上达到顶尖水平，以模拟真实世界中的复杂检测场景，从而构建一个公平且具有区分度的评估基准。

常用场景

经典使用场景

在计算机视觉与数字媒体取证领域，Mirage-Test数据集作为专为评估AI生成图像检测模型而设计的基准测试集，其经典使用场景集中于模型泛化能力的系统性评测。该数据集涵盖动物、动漫、人物、物体与场景五大内容域，通过整合真实图像与由先进生成模型合成的高保真伪造图像，为研究者提供了一个跨语义多样性的标准化测试平台。在此场景下，模型需在未见过的视觉内容上执行二分类任务，从而客观衡量其抵御分布外样本的鲁棒性与泛化性能。

解决学术问题

该数据集致力于解决AI生成图像检测研究中模型泛化能力不足的核心学术问题。随着生成式AI技术的飞速发展，伪造图像的视觉逼真度不断提升，导致现有检测模型极易过拟合于特定生成器或内容类型，在跨域、跨语义的开放环境中性能显著下降。Mirage-Test通过构建多领域、高质量的真实-伪造图像对，为量化模型在复杂真实场景下的泛化差距提供了严谨的评估基准，推动了检测技术从狭隘的实验室设置向通用化、鲁棒性方向的演进。

衍生相关工作

围绕Mirage-Test数据集，已衍生出一系列聚焦于通用AI生成图像检测的经典研究工作。其关联论文《OmniAID: Decoupling Semantic and Artifacts for Universal AI-Generated Image Detection in the Wild》提出了解耦语义与伪造痕迹的创新框架，为该领域设立了新的技术标杆。此外，该数据集常被后续研究用作对比基准，以验证新型检测架构、跨域适应方法以及泛化增强策略的有效性，促进了学术界对通用检测器设计范式的深入探索与技术迭代。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集