Magic Videos

Name: Magic Videos
Creator: 哈尔滨工业大学（深圳）; 鹏城实验室; 北京大学
Published: 2026-04-06 20:36:08
License: 暂无描述

arXiv2026-04-06 更新2026-04-07 收录

下载链接：

https://github.com/mgiant/Qwen2.5ViT-AIGVDetection

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由哈尔滨工业大学（深圳）联合鹏城实验室等机构构建，包含来自15种前沿开源和商业视频生成模型的14万条视频样本，涵盖240p-768p分辨率及1-10秒时长。数据通过VBench平台、MovieGen专有模型及定制提示库合成，重点采集景观、建筑和人际交互等高危伪造场景。其创新性在于保留原生分辨率时空特征，解决了传统下采样导致的高频伪影丢失问题，为AI生成视频检测领域提供了首个跨模型、多分辨率的基准测试平台。

This dataset was developed by Harbin Institute of Technology (Shenzhen) in partnership with institutions including Peng Cheng Laboratory. It comprises 140,000 video samples sourced from 15 state-of-the-art open-source and commercial video generation models, with resolutions spanning 240p to 768p and durations ranging from 1 to 10 seconds. The data was synthesized through the VBench platform, the proprietary MovieGen model, and a custom prompt library, with a focus on high-risk forgery scenarios such as landscapes, architectural scenes, and interpersonal interactions. Its core innovation lies in preserving native-resolution spatiotemporal features, which resolves the problem of high-frequency artifact loss caused by traditional downsampling, thereby providing the first cross-model, multi-resolution benchmark platform for the field of AI-generated video detection.

提供机构：

哈尔滨工业大学（深圳）; 鹏城实验室; 北京大学

创建时间：

2026-04-06

原始信息汇总

Qwen2.5-ViT For AI-generated video detection 数据集概述

一、数据集来源与用途

该数据集用于支持ICLR26论文《Preserving Forgery Artifacts: AI-Generated Video Detection at Native Scale》的研究，旨在进行AI生成视频的检测。

二、训练数据集

VBench sampled videos
- 来源地址：https://github.com/Vchitect/VBench/tree/master/sampled_videos
Kinetics
- 来源地址：https://github.com/cvdfoundation/kinetics-dataset

三、评估数据集

Magic Videos (Ours)
- 来源地址：https://huggingface.co/datasets/mgiant/magic_videos
GenVideo-Val
- 来源地址：https://modelscope.cn/datasets/cccnju/Gen-Video/files
DVF
- 来源地址：https://github.com/SparkleXFantasy/MM-Det
DeepTraceReward
- 来源地址：https://huggingface.co/datasets/DeeptraceReward/RewardData

搜集汇总

数据集介绍

构建方式

在人工智能生成内容检测领域，构建高质量数据集是推动模型泛化能力的关键。Magic Videos数据集的构建采用了系统化的流程，首先从真实视频中筛选高质量描述，利用ShareGPT4Video库获取详细字幕，并针对信息安全隐患较高的场景（如自然景观、建筑与人际互动）进行内容精选。这些描述经过GPT-4o优化，压缩至500字符以内，形成精炼提示词。随后，使用15种前沿开源与商业视频生成模型，包括扩散U-Net、DiT架构及自回归模型，生成超过14万段视频，确保了数据在模型架构、分辨率与时长上的多样性。验证集则采用Movie Gen生成的视频与Panda-70M的真实视频配对，而Magic Videos基准测试集则通过六种最新生成模型结合定制提示库合成，专注于超现实合成内容的评估。

特点

Magic Videos数据集的显著特点在于其时效性与多样性。该数据集涵盖了2023年至2025年间发布的15种视频生成模型，包括开源、报告公开及私有商业系统，广泛代表了当前生成技术的演进。视频分辨率范围从240p到1080p，时长介于1至12秒，充分捕获了不同模型在空间细节与时间连贯性上的差异。数据集的构建强调语义一致性，所有生成视频均基于同一提示库，这为跨模型验证提供了可控环境。此外，基准测试部分专门针对高保真合成内容设计，通过精心筛选的真实视频与生成视频配对，支持二元分类评估，有效反映了现代生成模型所达到的逼真程度，为检测模型提供了严峻的测试场景。

使用方法

Magic Videos数据集主要用于训练与评估AI生成视频检测模型。在训练阶段，研究者可将70K生成视频与70K真实视频（源自Kinetics-400）结合，构建平衡的训练集。数据预处理需保持视频原生分辨率，避免固定尺寸的缩放或裁剪，以保留高频伪造痕迹。推荐采用基于Qwen2.5-VL Vision Transformer的检测框架，该框架支持可变空间分辨率与时间长度，通过三维块化处理原生输入，有效捕捉时空不一致性。评估时，可使用Magic Videos基准测试集及外部数据集（如DVF、GenVideo）进行跨模型与跨数据集验证，以测试模型泛化能力。数据集的提示词控制特性有助于减少内容偏差，促使模型学习通用伪造特征而非特定场景模式。

背景与挑战

背景概述

Magic Videos数据集由哈尔滨工业大学（深圳）、鹏城实验室和北京大学的研究团队于2026年构建，旨在应对人工智能生成视频检测领域的紧迫需求。随着视频生成模型的飞速发展，高度逼真的合成媒体不断涌现，对信息安全和公众信任构成严峻威胁。该数据集汇集了来自15个先进开源与商业生成器的超过14万条视频，并专门设计了用于评估超现实合成内容的Magic Videos基准。其核心研究在于解决现有检测方法因固定分辨率预处理而丢失细微伪造痕迹的局限性，通过原生尺度处理框架保留高频伪影与时空不一致性，为AI生成视频检测奠定了新的数据基础与评估标准。

当前挑战

Magic Videos数据集面临的挑战主要体现在两个方面：其一，在领域问题层面，AI生成视频检测需应对生成模型快速迭代带来的泛化性难题，现有方法往往依赖于过时的合成数据，难以捕捉现代生成模型的复杂特征，导致在跨模型、跨分辨率场景下性能显著下降；其二，在构建过程中，数据集的创建需平衡多样性与质量，涵盖不同架构、分辨率与时长的视频，同时避免预处理操作（如裁剪、缩放）造成的信息损失与空间失真，这对数据采集、标注与基准设计提出了极高的技术要求。

常用场景

经典使用场景

在人工智能生成内容检测领域，Magic Videos数据集被广泛应用于评估视频伪造检测模型的泛化能力与鲁棒性。该数据集汇集了来自15种前沿视频生成模型的高质量合成视频，覆盖了从扩散U-Net、扩散Transformer到自回归模型等多种架构，确保了数据源的多样性与时代性。研究者通常利用该数据集训练检测器，以捕捉合成视频中细微的时空不一致性与高频伪造痕迹，特别是在处理高分辨率、长时程视频时，其原生尺度处理能力能够有效保留传统预处理中易丢失的伪造特征。

解决学术问题

Magic Videos数据集主要解决了当前AI生成视频检测中的两大核心学术问题：一是现有方法因依赖固定分辨率缩放与裁剪操作而导致的高频伪造痕迹丢失与空间失真问题；二是训练数据陈旧无法匹配现代生成模型复杂度的泛化困境。通过提供大规模、多源、高保真的合成视频数据，该数据集使研究者能够开发出在原生尺度上操作的检测框架，从而更准确地识别合成内容中的像素级伪影与语义不一致性，推动了跨模型、跨分辨率鲁棒检测方法的发展。

衍生相关工作

Magic Videos数据集的发布催生了一系列围绕原生尺度检测与跨模型泛化的经典研究工作。例如，基于Qwen2.5-VL Vision Transformer的检测框架通过三维块化与动态分辨率处理，实现了对合成视频中时空伪造特征的高效提取；后续研究则进一步探索了参数高效微调策略与多模态融合方法，以提升检测效率与可解释性。这些衍生工作不仅巩固了原生尺度处理在伪造检测中的核心地位，也为构建适应快速演进的生成技术的检测生态系统奠定了理论基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集

Magic Videos

Qwen2.5-ViT For AI-generated video detection 数据集概述

一、 数据集来源与用途

二、 训练数据集

三、 评估数据集

一、数据集来源与用途

二、训练数据集

三、评估数据集