SynthForensics
收藏SynthForensics 数据集概述
基本信息
- 数据集名称:SynthForensics
- 语言:英语
- 许可证:MIT
- 任务类别:视频分类(深度伪造检测)
- 标签:deepfake、deepfake-detection、synthetic-video、forensics、video、face、text-to-video、 image-to-video
- 数据规模:100,000 < 样本数 < 1,000,000
数据集描述
SynthForensics 是一个用于评估和基准测试以人为中心的合成视频深度伪造检测的数据集。它包含来自 8 个 T2V(文本到视频)和 7 个 I2V(图像到视频)开源生成器的 20,445 个视频,这些视频与 1,363 个来自 FF++/DFD 的真实视频配对,经过两阶段人工验证,并提供四种压缩版本及完整元数据。
主要特点
- 覆盖 15 个主流开源视频生成器
- 视频分辨率和时长多样化
- 包含多种压缩级别(raw、canonical、crf23、crf40)
- 提供训练/验证/测试集的官方划分
- 继承并兼容 FaceForensics++ 评估协议
数据集结构
SynthForensics/ ├── T2V/ # 文本到视频分支 │ ├── videos/ │ │ ├── raw/ # 原始未压缩视频 │ │ ├── canonical/ # 标准压缩版本 │ │ ├── crf23/ # CRF23 压缩版本 │ │ └── crf40/ # CRF40 压缩版本 │ └── metadata/ # 每个生成器的元数据 ├── I2V/ # 图像到视频分支 │ ├── videos/ # 同上压缩级别结构 │ ├── i2v_frames/ # 参考帧(条件输入图像) │ └── metadata/ # 每个生成器的元数据 ├── captions/ # 密集字幕(FF++ 和 DFD 源视频) ├── train.json # 训练集划分 ├── test.json # 测试集划分 ├── val.json # 验证集划分 └── README.md
命名规则
- FF++ 样本:
<ID>_<generator>_t2v.mp4/<ID>_<generator>_i2v.mp4(ID 为三位数字) - DFD 样本:
<subject_id>__<scene>_<generator>_t2v.mp4/<subject_id>__<scene>_<generator>_i2v.mp4
数据划分
- 训练/测试/验证集的划分继承自 FaceForensics++ 数据集
- 测试集补充:包含完整的 DeepFakeDetection(DFD)数据集作为域外评估来源
- 真实视频来自 FF++ 数据集,与伪造视频一一对应
生成器与数据统计
生成器列表(共15个)
| 分支 | 显示名称 | 目录名称 | 原始视频数 |
|---|---|---|---|
| T2V | CogVideoX | cogvideox | 1,363 |
| T2V | DaVinci-MagiHuman | daVinci-MagiHuman | 1,363 |
| T2V | Helios | helios | 1,363 |
| T2V | LTX-2.3 | ltx2-3 | 1,363 |
| T2V | Magi-1 | magi-1 | 1,363 |
| T2V | Self-Forcing | self-forcing | 1,363 |
| T2V | SkyReels-V2 | skyreels-v2 | 1,363 |
| T2V | Wan2.1 | wan2-1 | 1,363 |
| I2V | CogVideoX | cogvideox | 1,363 |
| I2V | DaVinci-MagiHuman | daVinci-MagiHuman | 1,363 |
| I2V | Helios | helios | 1,363 |
| I2V | LTX-2.3 | ltx2-3 | 1,363 |
| I2V | Magi-1 | magi-1 | 1,363 |
| I2V | SkyReels-V2 | skyreels-v2 | 1,363 |
| I2V | Wan2.1 | wan2-1 | 1,363 |
整体统计
| 指标 | 数值 |
|---|---|
| 唯一合成视频(T2V) | 10,904 |
| 唯一合成视频(I2V) | 9,541 |
| 唯一合成视频总数 | 20,445 |
| 视频文件总数(4种压缩) | 81,780 |
| 唯一帧总数 | 1,934,097 |
| 总视频时长 | ~27.2 小时 |
| 横屏视频 | 16,349 |
| 竖屏视频 | 4,096 |
| 分辨率范围(宽×高) | 640×384 – 1920×1088 |
| 帧率范围(FPS) | 8 – 25 |
| 时长范围(秒) | 4 – 6 |




