Ivy-Fake

github2025-06-02 更新2025-06-03 收录

下载链接：

https://github.com/Pi3AI/IvyFake

下载链接

链接失效反馈

官方服务：

资源简介：

Ivy-Fake是一个新颖的、统一的大规模数据集，专门用于可解释的多模态AI生成内容检测。它是第一个用于此目的的大规模基准，涵盖图像和视频。该项目还引入了Ivy-XDetector，一个统一的视觉语言模型，在检测和解释AI生成的图像和视频方面达到了最先进的性能。

Ivy-Fake is a novel, unified large-scale dataset dedicated to explainable multi-modal AI-generated content detection. It is the first large-scale benchmark for this purpose, covering both images and videos. This project also introduces Ivy-XDetector, a unified vision-language model that achieves state-of-the-art performance in detecting and explaining AI-generated images and videos.

创建时间：

2025-05-29

原始信息汇总

Ivy-Fake 数据集概述

数据集简介

Ivy-Fake 是一个新颖、统一且大规模的数据集，专门为可解释的多模态AI生成内容（AIGC）检测而设计。它是首个用于此目的的大规模基准数据集，涵盖图像和视频两种模态。

关键特性

统一多模态数据集：包含超过150,000个丰富注释的训练样本（图像和视频）和18,700个评估样本。
可解释的注释：每个样本附带详细的自然语言推理，解释检测到的空间和时间伪影。
IVY-XDETECTOR模型：统一的视觉-语言架构，实现最先进的检测性能，并提供人类可读的解释。
现实场景关注：数据集包含由各种前沿架构（GANs、扩散模型、Transformers）生成的内容以及真实世界中的真实内容。
公开可用：数据集在Hugging Face Datasets上公开可用。

项目概述

Ivy-Fake框架通过深入分析时间和空间伪影，实现可解释的AI生成内容检测。

IVY-XDETECTOR模型采用三阶段渐进式训练框架：

通用视频理解：赋予模型基本的视频理解能力。
AIGC检测微调：使模型专门用于二分类AIGC判别（真实与伪造）。
检测与可解释性联合优化：使模型在保持检测准确性的同时生成高质量的解释。

数据集访问

Hugging Face：https://huggingface.co/datasets/AI-Safeguard/Ivy-Fake
代码仓库：https://github.com/Pi3AI/IvyFake

引用

bibtex @article{jiang2025ivyfake, title = {Ivy-Fake: A Unified Explainable Framework and Benchmark for Image and Video AIGC Detection}, author = {Jiang, Changjiang and Zhang, Wayne and Zhang, Zhonghao and Yu, Fengchang and Peng, Wei}, year = {2025} }

搜集汇总

数据集介绍

构建方式

在人工智能生成内容（AIGC）检测领域，Ivy-Fake数据集通过系统化采集与标注流程构建而成。研究团队整合了包括GANs、扩散模型和Transformer在内的多种前沿架构生成的图像与视频内容，同时收录真实场景下的多媒体数据。数据集构建采用三阶段渐进式框架，首阶段聚焦通用视频理解，次阶段专攻AIGC二元检测，最终阶段实现检测与可解释性的联合优化，形成包含15万训练样本和1.87万评估样本的多模态语料库。

特点

该数据集在AIGC检测领域展现出显著的多维优势。其突破性地统一了图像与视频双模态数据，每个样本均附带自然语言推理注释，详细揭示时空伪影特征，超越了传统二元标签的局限。数据覆盖20余种生成模型产出的内容，特别强调真实场景下的应用价值，检测目标包含局部空间异常和时序不一致等细粒度特征。配套的IVY-XDETECTOR模型通过视觉-语言联合架构，同步实现高精度检测与人类可读的解释生成。

使用方法

研究者可通过Hugging Face平台直接访问该数据集，其标准化接口支持灵活加载图像、视频及对应解释文本。使用流程建议遵循三阶段建模范式：先利用通用视频理解模块建立基础表征能力，继而采用二元分类头进行AIGC检测微调，最终联合优化检测准确率与解释生成质量。配套代码库提供完整的环境配置指南和模型训练脚本，支持跨模态特征提取、可解释性可视化等研究需求，用户可基于PyTorch框架进行二次开发。

背景与挑战

背景概述

Ivy-Fake数据集由Pi3AI团队于2025年推出，旨在应对人工智能生成内容（AIGC）检测领域的核心挑战。随着GANs、扩散模型等生成式AI技术的迅猛发展，高度逼真的合成媒体对数字内容真实性构成了严峻威胁。该数据集由Changjiang Jiang等学者构建，首次实现了跨图像与视频模态的统一标注框架，包含超过15万训练样本和1.87万评估样本，其创新性在于融合了多模态检测与可解释性分析。作为首个大规模可解释AIGC检测基准，Ivy-Fake通过提供详细的空间-时间伪影描述和自然语言推理标注，推动了检测模型从黑箱决策向透明化分析的范式转变。

当前挑战

在领域问题层面，Ivy-Fake致力于解决生成式AI内容检测中的三大核心挑战：多模态统一检测框架的缺失、现有方法可解释性不足，以及跨模型生成内容的泛化检测难题。数据集构建过程中，研究团队面临双重技术壁垒：一方面需精确标注不同生成架构（如Stable Diffusion与StyleGAN）的特异性伪影特征，另一方面要设计兼顾时空维度的解释性标注体系。视频样本的时序伪影标注尤为复杂，需开发半自动化工具辅助人工验证。此外，保持检测模型性能与解释质量的正交优化，成为后续算法开发的关键瓶颈。

常用场景

经典使用场景

在多媒体内容真实性验证领域，Ivy-Fake数据集为研究人员提供了一个统一的基准平台，用于开发和评估多模态AI生成内容检测算法。该数据集通过整合图像和视频两种模态的丰富标注样本，支持从单一模态到跨模态的检测任务迁移研究，特别适用于验证模型在复杂真实场景中的泛化能力。其独特的解释性标注体系使得算法不仅能判断内容真伪，更能定位并描述生成过程中产生的时空伪影特征。

实际应用

在实际应用层面，Ivy-Fake支撑了多个关键场景的技术落地。社交媒体平台可利用其训练的检测模型实时筛查用户上传的疑似合成内容，新闻机构可借助解释性输出进行事实核查。在数字版权保护领域，该数据集帮助开发鉴别AI生成艺术品真伪的工具。更为重要的是，其跨模态检测能力为深度伪造内容识别提供了端到端的解决方案，在网络安全、司法取证等场景展现出重要价值。

衍生相关工作

基于Ivy-Fake的基准特性，已衍生出若干具有影响力的研究方向。部分研究团队专注于增强解释性标注的细粒度，开发了基于视觉-语言对齐的伪影定位算法。另有工作利用其多模态特性，提出了跨模态知识蒸馏框架来提升检测效率。值得关注的是，该数据集还催生了针对新型生成模型的对抗样本研究，推动了检测模型与生成模型在博弈中共同进化的学术范式。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集