five

AEGIS

收藏
Hugging Face2025-05-31 更新2025-06-01 收录
下载链接:
https://huggingface.co/datasets/Clarifiedfish/AEGIS
下载链接
链接失效反馈
官方服务:
资源简介:
AEGIS(真实性评估在生成的视频样本上)是一个严格的基准测试,用于评估多模态模型在AI生成视频检测和推理方面的能力。AEGIS硬测试集是经过精心挑选的子集,旨在在现实世界的欺骗性场景下对模型的鲁棒性进行压力测试。
创建时间:
2025-05-30
原始信息汇总

AEGIS数据集概述

数据集基本信息

  • 名称: AEGIS (Authenticity Evaluation on Generated vIdeo Samples)
  • 类型: 多模态视频数据集
  • 子集: Hard Test Set
  • 完整数据集: AEGIS-Full
  • 下载大小: 1.51GB
  • 数据集大小: 1.51GB
  • 示例数量: 436

数据特征

  • keyframes: 8个代表性帧图像列表
  • optical_flow: 2个光流图像列表
  • frequency_spectrum: 首帧频谱图像
  • description: 视频内容文本摘要
  • reason: 真实性推理指导
  • meta_data: 元数据(标签、分辨率等)
  • framediff_analysis: 帧间差异分析数据

相关数据集

  1. AEGIS-Full: 完整数据集
  2. AEGIS-Baseline: 训练和验证子集

基准评估结果

模型 设置 准确率(全部) 准确率(真实) 准确率(AI) Macro F1
Qwen2.5-VL 3B Zero-shot 0.52 0.80 0.23 0.48
Qwen2.5-VL 7B Zero-shot 0.59 0.89 0.22 0.52
Video-LLaVA-HF 7B Zero-shot 0.50 0.00 1.00 0.33
Qwen2.5-VL 3B Reasoning-Prompt 0.47 0.58 0.35 0.46
Qwen2.5-VL 7B Reasoning-Prompt 0.57 0.97 0.16 0.48
Video-LLaVA-HF 7B Reasoning-Prompt 0.46 0.29 0.63 0.45
Qwen2.5-VL 3B LoRA Fine-tuning 0.56 0.14 0.97 0.47
Qwen2.5-VL 7B LoRA Fine-tuning 0.61 0.99 0.24 0.55

数据来源

使用许可

  • 用途限制: 仅限学术研究
  • 禁止再分发: 未经许可不得修改或传播
  • 引用要求: 必须引用AEGIS及原始数据集
  • 许可证类型: 自定义学术使用许可
搜集汇总
数据集介绍
main_image_url
构建方式
在人工智能生成视频检测领域,AEGIS数据集的构建采用严谨的多阶段流程。数据采集阶段整合真实视频与合成视频资源,特别引入高保真度自生成样本以增强多样性。通过严格的质量筛选机制剔除低质量或易识别样本,确保数据集的挑战性。最终划分为训练集、验证集及硬测试集三个子集,为模型鲁棒性评估提供结构化支持。
使用方法
数据集支持多种前沿评估范式,包括零样本检测、思维链推理提示和参数高效微调。研究人员可通过加载关键帧与光学流特征进行视觉分析,结合描述文本实现多模态推理。基准评估表明,采用结构化提示词能显著提升模型对生成视频伪影的识别能力,而基于LoRA的微调策略在保持参数效率的同时可获得最佳宏观F1分数。
背景与挑战
背景概述
随着生成式人工智能技术的迅猛发展,合成视频的逼真度显著提升,对多媒体内容真实性的鉴别成为亟待解决的科学问题。AEGIS数据集由研究团队于2024年创建,旨在构建一个多模态基准测试平台,专门评估模型在AI生成视频检测与推理方面的能力。该数据集整合了真实视频与多种先进生成模型合成的视频样本,通过精心设计的硬测试集挑战现有模型的鲁棒性,为数字媒体取证领域提供了重要的评估工具。
当前挑战
AEGIS数据集致力于解决生成视频真实性鉴别的核心难题,包括高频域伪影识别、光影一致性分析、物理场景合理性判断等跨模态推理挑战。在构建过程中,研究团队面临高质量合成视频样本筛选的复杂性,需排除易于识别的低质量样本以确保测试集的严谨性;同时,多模态特征对齐与标注的一致性维护亦构成技术瓶颈,尤其在光学流矩阵与关键帧语义匹配方面需克服大量计算与人工校验压力。
常用场景
经典使用场景
在生成式视频检测领域,AEGIS数据集作为一项严谨的基准测试工具,主要用于评估多模态模型在区分真实视频与AI生成视频方面的能力。该数据集通过提供关键帧序列、光流图像、频谱特征等多模态信息,支持模型从空间结构、时间动态和频域特征等多个维度进行综合分析。其经典使用场景包括零样本检测、结构化推理提示微调以及基于LoRA的适配训练,旨在系统检验模型在高度逼真、具有欺骗性场景下的鲁棒性。
解决学术问题
AEGIS数据集致力于解决生成式视频真实性鉴别中的核心学术问题,如模型对高频信息缺失、光影一致性异常、物理合理性违反等细微伪影的敏感度不足问题。通过引入难度较高的测试子集,该数据集推动了多模态推理模型在频域分析、运动连贯性检验等方面的理论突破,显著提升了生成内容检测任务的科学性与可解释性,为数字媒体真实性认证提供了重要的理论支撑。
实际应用
在实际应用层面,AEGIS数据集为互联网内容审核、数字证据鉴定、版权保护等场景提供了关键技术支持。例如,社交媒体平台可借助基于该数据集训练的检测模型,自动识别并过滤恶意生成的虚假新闻视频;司法鉴定机构能够利用其多模态特征分析框架,对涉嫌篡改的视频证据进行科学验证。这些应用有效遏制了生成式技术滥用带来的社会风险,维护了数字信息的可信生态。
数据集最近研究
最新研究方向
在生成式视频检测领域,AEGIS数据集作为评估多模态模型识别AI生成视频能力的重要基准,正推动着检测技术向更精细化的方向发展。当前研究聚焦于利用该数据集提供的多模态特征,如关键帧序列、光流分析和频谱图像,深入探索生成视频在频域伪影、光影一致性及物理合理性等方面的细微异常。前沿工作尝试结合结构化推理提示与轻量级微调策略,显著提升了模型在复杂对抗场景下的泛化性能。这一进展不仅为数字内容真实性认证提供了关键技术支撑,也对防范生成技术滥用具有深远的社会意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作