AIGVDBench

github2026-01-05 更新2026-01-22 收录

下载链接：

https://github.com/LongMa-2025/AIGVDBench

下载链接

链接失效反馈

官方服务：

资源简介：

AIGVDBench是一个大规模、高质量的AI生成视频检测基准数据集，旨在解决数据集规模和模型多样性的关键限制。该数据集包含来自31个生成模型的超过440,000个视频，涵盖文本到视频（T2V）、图像到视频（I2V）、视频到视频（V2V）以及真实场景。

AIGVDBench is a large-scale, high-quality benchmark dataset for AI-generated video detection, designed to address the critical limitations in dataset scale and model diversity. It contains over 440,000 videos from 31 generative models, covering text-to-video (T2V), image-to-video (I2V), video-to-video (V2V), and real-world scenarios.

创建时间：

2026-01-04

原始信息汇总

AIGVDBench: AI生成视频检测综合基准数据集概述

数据集简介

AIGVDBench是一个用于AI生成视频检测的大规模、高质量基准数据集，旨在解决现有数据集在规模和模型多样性方面的关键限制。该基准包含来自31个生成模型的超过440,000个视频，涵盖文本到视频（T2V）、图像到视频（I2V）、视频到视频（V2V）以及真实世界场景。

关键贡献

标准化的基准构建流程，确保代表性和可复现性。
包含来自多样化生成模型的422K+视频的高质量基准。
对4个类别中的33个检测器进行了系统评估，包含8项深入分析。
识别出4个新发现，为未来研究方向提供见解。

数据集规模与多样性

AIGVDBench在规模、内容多样性、生成任务覆盖范围以及视频生成模型种类方面显著超越现有数据集。它包含由31个不同模型（20个开源和11个闭源）生成的视频，涵盖23个T2V、6个I2V和2个V2V生成模型。

数据集详情

包含的生成模型

开源模型（20个）： Open-Sora, RepVideo, AccVideo, CogVideoX, EasyAnimate, Wan2.1, VideoCrafter, Pyramid-Flow, IPOC, Hunyuan等。
闭源模型（11个）： Sora, Kling, Gen2, Gen3等。

数据统计

类别	开源模型	闭源模型
训练视频	每个模型14,000个	-
测试视频	每个模型3,000个	每个模型2,000个
真实视频	14,000个	每个模型2,000个

基准评估结果

评估的检测器类别

视频分类模型： MViTv2, UniFormer, VideoSwin, VideoMAE, TSM, SlowFast, TimeSformer等。
AI生成图像检测模型： NPR, FreDect, Fusing, Gram-Net, CNNSpot, D3等。
AI生成视频检测模型： DeMamba, DeCoF。
视觉-语言模型： Emu3-Stage1, FastVLM, DeepseekVL, LLaVA, Kimi-VL等。

深入分析要点

开源与闭源模型可检测性： 闭源模型更难检测。
生成任务的影响： 检测性能在T2V、I2V、V2V任务间存在差异；V2V最具挑战性。

数据获取

AIGVDBench数据集公开可用：

🤗 Hugging Face Datasets: https://huggingface.co/datasets/AIGVDBench/AIGVDBench
☁️ Quark Cloud Drive: https://pan.quark.cn/s/b9d0548b310c

致谢

感谢OpenVid-HD慷慨允许开源真实世界视频源。同时感谢VBench评估框架以及所有开源视频生成模型社区的贡献与启发。

搜集汇总

数据集介绍

构建方式

在人工智能生成视频检测领域，构建具有代表性和可复现性的基准数据集至关重要。AIGVDBench采用标准化的构建流程，系统性地整合了来自31种不同生成模型的超过44万条视频数据。该流程涵盖了文本到视频、图像到视频及视频到视频等多种生成任务，并纳入了真实场景视频以增强数据生态的完整性。通过精心设计的采样与平衡策略，确保了数据在模型类型、任务类别和内容分布上的广泛覆盖，为后续的模型评估奠定了坚实的数据基础。

使用方法

该数据集为研究者提供了便捷的访问途径，可通过Hugging Face平台或指定的云存储服务直接获取。用户可将其用于训练和评估各类AI生成视频检测模型，包括视频分类模型、专为生成图像设计的检测器、新兴的视频检测架构以及大规模视觉语言模型。数据集已预先划分为训练集与测试集，并附有详细的模型来源与任务标签，支持跨模型泛化能力分析、生成任务难度比较以及开源与闭源模型可检测性等前沿研究方向的深入探索。

背景与挑战

背景概述

在人工智能生成内容技术迅猛发展的背景下，视频生成模型如Sora、Kling等不断涌现，其生成内容的逼真度日益提升，对数字内容真实性鉴别提出了严峻挑战。AIGVDBench作为一个大规模、高质量的AI生成视频检测基准，由研究团队于2025年构建，旨在系统评估检测模型的性能。该数据集整合了来自31种生成模型的超过44万条视频，涵盖文本到视频、图像到视频、视频到视频及真实场景等多种生成任务，其规模与多样性均显著超越现有基准，为视频真伪鉴别领域提供了关键的数据支撑与研究范式。

当前挑战

AIGVDBench致力于解决AI生成视频检测这一核心领域问题，其挑战在于生成模型技术的快速迭代导致检测器泛化能力不足，尤其是闭源模型因其技术不透明而更难被准确识别。构建过程中，研究团队面临数据规模与质量平衡的难题，需确保来自20种开源与11种闭源模型的视频具有代表性，同时涵盖多样化的生成任务与真实场景，以规避数据偏差。此外，基准的标准化流程设计需保证可复现性，并对33种检测器进行跨类别系统评估，从而揭示生成任务差异对检测性能的影响，为未来研究指明方向。

常用场景

经典使用场景

在人工智能生成内容检测领域，AIGVDBench作为大规模、高质量的基准数据集，其经典使用场景集中于评估和比较各类AI生成视频检测模型的性能。该数据集通过整合来自31种生成模型的超过44万条视频，覆盖文本到视频、图像到视频及视频到视频等多种生成任务，为研究者提供了一个标准化的测试平台。在此场景下，研究人员能够系统性地分析不同检测器在多样化生成内容上的表现，从而揭示模型在泛化能力、鲁棒性及跨任务适应性方面的优劣，推动检测技术的迭代与优化。

解决学术问题

AIGVDBench致力于解决当前AI生成视频检测研究中数据集规模有限、模型覆盖不足以及评估标准不统一等核心学术问题。通过构建涵盖开源与闭源模型的广泛视频样本，该数据集使研究者能够深入探究生成模型的技术特性对检测难度的影响，例如闭源模型通常更具隐蔽性。此外，它支持对检测算法进行跨任务性能分析，识别出视频到视频生成内容检测这一最具挑战性的方向，为后续理论突破与方法创新提供了实证基础。

实际应用

在实际应用层面，AIGVDBench为内容审核、数字取证和网络安全等领域提供了关键的数据支持。随着AI生成视频技术的普及，虚假信息传播和数字身份伪造等风险日益凸显。该数据集通过包含真实场景视频与多样化生成内容，助力开发高精度的自动检测工具，帮助平台运营商、执法机构及媒体机构有效识别并管理AI生成的视听材料，维护数字环境的真实性与可信度，具有显著的社会价值。

数据集最近研究