FakePartsBench
收藏arXiv2025-08-29 更新2025-11-25 收录
下载链接:
https://hf-mirror.com/datasets/hi-paris/FakeParts
下载链接
链接失效反馈官方服务:
资源简介:
FakePartsBench 是一个大规模的基准数据集,专门设计用于捕捉各种部分深度伪造视频,包括像素级和帧级操纵注释。该数据集包含超过 25,000 个视频,涵盖从传统的人脸交换到最先进的生成视频等多种操纵技术,特别强调包括局部修复、风格迁移、物体替换和帧特定修改以及时间插值在内的部分操纵。我们的数据集从公共和私人视频来源中提取,在内容、上下文和操纵技术方面提供了前所未有的多样性。FakePartsBench 支持对明显和隐蔽的伪造进行检测的研究,通过结合大规模覆盖、高分辨率和细粒度注释,它能够对下一代深度伪造检测模型进行严格的评估。
FakePartsBench is a large-scale benchmark dataset specifically developed to capture a wide range of partial deepfake videos, accompanied by pixel-level and frame-level manipulation annotations. This dataset comprises over 25,000 videos covering a broad spectrum of manipulation techniques, ranging from traditional face swapping to state-of-the-art generative videos, with a particular focus on partial manipulations including inpainting, style transfer, object replacement, frame-specific modification, and temporal interpolation. Our dataset is sourced from both public and private video repositories, delivering unprecedented diversity in content, context, and manipulation techniques. FakePartsBench supports research on detecting both overt and covert forgeries, and enables rigorous evaluation of next-generation deepfake detection models through its large-scale coverage, high-resolution content, and fine-grained annotations.
提供机构:
Hi!PARIS, Institut Polytechnique de Paris, LIX, École Polytechnique, CNRS, U2IS, ENSTA Paris
创建时间:
2025-08-29
搜集汇总
数据集介绍

构建方式
在深度伪造技术快速演进的背景下,FakePartsBench通过整合多样化的生成模型构建了首个专注于局部操纵的基准数据集。该数据集涵盖超过25,000个视频样本,采用文本到视频、图像到视频及混合生成技术,并结合空间层面的面部替换、物体修复与背景扩展,时间维度的帧插值操作,以及风格迁移等局部篡改方法。所有样本均通过前沿开源与闭源模型生成,并辅以像素级与帧级精细标注,确保了数据构建的全面性与技术前沿性。
特点
作为针对局部深度伪造的专项基准,FakePartsBench的突出特点在于其操纵的隐蔽性与语义连贯性。数据集不仅包含传统全合成伪造内容,更聚焦于空间局部篡改、时间片段干预及风格转换等新型攻击模式,这些操纵通过保留原始视频的多数真实内容,实现了与真实元素的无缝融合。其样本覆盖高分辨率视频与多模态生成技术,同时提供细粒度标注体系,为检测模型应对渐进式篡改挑战提供了关键研究基础。
使用方法
该数据集支持通过标准化协议对深度伪造检测模型进行系统评估。研究者可基于像素级与时间戳标注,开发针对局部不一致性的识别算法,或利用多模态提示信息探索跨内容泛化能力。评估流程包含图像级与视频级检测器的对比测试,同时结合人类感知研究验证模型鲁棒性。通过提供生成元数据与操纵轨迹,数据集进一步助力可解释性分析与防御策略创新。
背景与挑战
背景概述
FakePartsBench由Hi!PARIS与巴黎综合理工学院研究团队于2025年提出,旨在应对局部深度伪造技术带来的新型安全威胁。该数据集聚焦于FakeParts这类在真实视频中嵌入局部时空篡改的深度伪造内容,涵盖面部表情篡改、物体替换、背景修改等精细操作。通过整合超过2.5万段视频并配备像素级与帧级标注,该数据集填补了现有基准在局部篡改检测领域的空白,为构建下一代深度伪造防御系统提供了关键数据支撑。
当前挑战
该数据集致力于解决局部深度伪造检测的核心难题:传统检测模型对高隐蔽性局部篡改的识别率普遍下降超过30%,且人类观察者的误判率提升40%。构建过程中面临双重挑战:在技术层面需协调多模态生成模型(如Sora、Veo2)与局部编辑工具(如ControlNet)的异构数据流;在数据质量层面需平衡高分辨率视频生成成本与标注精度,同时确保时空篡改区域标注的细粒度一致性。
常用场景
经典使用场景
在深度伪造检测研究领域,FakePartsBench作为首个专注于局部视频篡改的基准数据集,其经典应用场景集中于评估检测模型对空间、时间和风格维度局部篡改的识别能力。该数据集通过融合人脸替换、物体修复、帧插值和风格迁移等多样化篡改技术,为研究者提供了系统验证检测算法鲁棒性的实验平台,尤其在应对高隐蔽性局部篡改场景中展现出独特价值。
衍生相关工作
基于该数据集衍生的经典研究包括DeMamba时空异常检测框架和CLIP驱动的通用伪造检测器UnivFD等重要工作。这些研究通过挖掘数据集中局部篡改特有的频率特征与语义不一致性,推动了检测模型从依赖低级伪影向理解高级语义特征的范式转变,为构建下一代自适应检测系统提供了理论支撑与方法创新。
数据集最近研究
最新研究方向
随着生成式人工智能技术的飞速发展,深度伪造检测领域正面临局部篡改视频带来的全新挑战。FakePartsBench数据集首次系统性地定义了FakeParts这一新型深度伪造范式,其通过空间区域篡改、时间片段插值和风格转换等精细操作,在真实视频中植入难以察觉的局部虚假内容。该数据集涵盖超过2.5万条视频样本,融合了Sora、Veo2等前沿生成模型的输出,并提供了像素级与帧级标注体系。当前研究热点聚焦于破解局部伪造的检测难题,实验表明传统检测模型对FakeParts的识别准确率骤降43%,而基于CLIP的语义检测器虽在局部篡改中表现优异,却难以应对高质量全合成视频。这一发现揭示了生成内容真实性演进与检测技术发展之间的博弈关系,为构建下一代鲁棒检测系统提供了关键基准。
相关研究论文
- 1通过Hi!PARIS, Institut Polytechnique de Paris, LIX, École Polytechnique, CNRS, U2IS, ENSTA Paris · 2025年
以上内容由遇见数据集搜集并总结生成



