CoCoVideo-26K
收藏github2026-04-08 更新2026-03-27 收录
下载链接:
https://github.com/DonoToT/CoCoVideo
下载链接
链接失效反馈官方服务:
资源简介:
CoCoVideo-26K是一个对比性的、基于商业模型的AIGC视频数据集,涵盖13个主流商业生成器,并提供语义对齐的真实-伪造视频对。该数据集能够更深入地探索真实视频与高质量合成视频之间的差异,并为高度真实的视频伪造检测建立新的基准。
CoCoVideo-26K is a contrastive, commercial-model-based AIGC video dataset. It covers 13 mainstream commercial video generators and provides semantically aligned real-and-fake video pairs. This dataset enables deeper exploration of the discrepancies between real videos and high-quality synthetic videos, and establishes a new benchmark for highly realistic video forgery detection.
创建时间:
2026-03-25
原始信息汇总
CoCoVideo数据集概述
数据集基本信息
- 数据集名称:CoCoVideo-26K
- 核心定位:基于商业模型的高质量对比基准数据集,用于AI生成视频检测
- 数据规模:26K(视频数量)
- 创建目的:解决现有数据集因依赖开源生成模型或包含可见水印而无法有效检测高保真AIGC视频的问题
数据集关键特性
- 生成源覆盖:涵盖13种主流商业视频生成器
- 数据构造:提供语义对齐的真实-伪造视频对
- 质量特点:包含高质量商业AIGC系统生成的合成视频,避免可见水印影响真实性
- 应用价值:支持深入探索真实视频与高质量合成视频之间的差异,为高真实度视频伪造检测建立新基准
相关技术框架
- 配套框架:CoCoDetect检测框架
- 框架特点:集成对比学习与基于置信度门控的多模态大语言模型推理
- 技术组成:使用R3D-18骨干网络提取时空表征,通过置信度门将不确定案例路由至MLLM进行物理合理性与场景一致性推理
实验验证
- 验证范围:在CoCoVideo-26K及公共基准测试上进行广泛实验
- 性能表现:展示了最先进的性能,验证了框架的鲁棒性与泛化能力
资源获取
- 代码与数据集地址:https://github.com/DonoToT/CoCoVideo
- 当前状态:代码库与数据集正在整理中,将于近期在本仓库公开释放
搜集汇总
数据集介绍

构建方式
在人工智能生成内容技术迅猛发展的背景下,CoCoVideo-26K数据集的构建旨在应对高保真伪造视频检测的挑战。该数据集通过整合13款主流商业视频生成模型,精心采集了语义对齐的真实与合成视频对,确保了样本的多样性与代表性。构建过程中,团队严格筛选了无可见水印的高质量合成视频,以模拟真实世界中的高欺骗性伪造场景,从而为检测模型提供了接近实际应用的训练与评估环境。
特点
CoCoVideo-26K数据集的核心特点在于其对比性与商业模型基础。它涵盖了广泛的商业生成器,提供了语义对齐的真实-伪造视频对,使得研究者能够深入探索高保真合成视频与真实视频之间的细微差异。数据集避免了常见水印问题,增强了样本的真实性,为检测算法的泛化能力设立了新的基准。这些特点共同支撑了该数据集在推动高现实感视频伪造检测研究中的独特价值。
使用方法
该数据集的使用方法侧重于支持对比学习与多模态推理框架的开发。研究者可以基于其提供的真实-伪造视频对,训练模型以提取时空表征,并利用置信度门控机制将不确定案例路由至多模态大语言模型进行物理合理性与场景一致性推理。这种使用方法不仅促进了检测性能的提升,还为评估模型在复杂高保真伪造场景下的鲁棒性与泛化能力提供了有效平台。
背景与挑战
背景概述
随着人工智能生成内容技术的飞速发展,视频伪造现象日益普遍,对公共舆论与社会安全构成了严峻挑战。现有深度伪造检测方法虽取得显著进展,但针对高质量商业AIGC视频的检测仍面临瓶颈,因既有数据集多依赖开源生成模型,其生成质量远低于商业系统,且部分含商业样本的数据集常保留可见水印,损害真实性并限制模型泛化能力。为此,研究团队于近期推出了CoCoVideo-26K数据集,该数据集由专业机构构建,涵盖13种主流商业视频生成器,并提供语义对齐的真实-伪造视频对,旨在深入探索高保真合成视频与真实视频间的差异,为高真实度视频伪造检测建立新基准。
当前挑战
在视频伪造检测领域,核心挑战在于区分由先进商业模型生成的高质量合成视频与真实视频,这些合成视频在视觉保真度与时间一致性上已接近真实,使得传统基于低级伪影的检测方法失效。构建CoCoVideo-26K数据集过程中,研究团队需克服多重困难:首先,商业生成模型通常封闭且访问受限,需通过合法途径获取高质量、无水印的合成视频样本;其次,为确保数据对比有效性,必须精心匹配真实与伪造视频在语义内容上的一致性,这涉及复杂的视频对齐与标注流程;此外,数据集需覆盖多样化的生成模型与场景,以全面反映现实世界中的伪造技术演变,这对数据收集的广度与深度提出了极高要求。
常用场景
经典使用场景
在人工智能生成内容(AIGC)技术迅猛发展的背景下,视频伪造现象日益普遍,对公共舆论与社会安全构成严峻挑战。CoCoVideo-26K数据集作为基于商业模型的高质量对比基准,其经典使用场景集中于深度伪造检测领域的研究与评估。该数据集通过提供13种主流商业生成器产生的语义对齐的真实-伪造视频对,为探索高保真合成视频与真实视频之间的细微差异提供了标准化实验平台,广泛应用于模型训练、性能比较及泛化能力测试。
实际应用
在实际应用层面,CoCoVideo-26K为社交媒体内容审核、新闻真实性验证及数字取证等关键领域提供了技术支持。随着AIGC视频在公共平台上的传播,快速准确地识别伪造内容成为维护信息生态安全的迫切需求。基于该数据集训练的检测模型,如集成了对比学习与置信度门控多模态大语言模型推理的CoCoDetect框架,能够有效部署于在线审核系统,辅助自动化识别高仿真伪造视频,提升平台对恶意虚假内容的拦截效率,保障公众免受误导性信息的侵害。
衍生相关工作
围绕CoCoVideo-26K数据集,已衍生出一系列经典研究工作,其中最突出的是CoCoDetect检测框架。该框架融合了对比学习策略与置信度门控的多模态大语言模型推理机制,利用R3D-18骨干网络提取时空表征,并通过门控路由将不确定案例交由大语言模型进行物理合理性与场景一致性推理。这一创新架构不仅在CoCoVideo-26K上实现了领先性能,也为后续研究提供了多模态融合与可解释性检测的新范式,激励了更多基于高质量商业数据集的算法探索与基准构建。
以上内容由遇见数据集搜集并总结生成



