FaceSwap Benchmark
收藏FaceSwap Benchmark 数据集详情
FaceSwap Benchmark 是一个用于评估人脸交换算法的结构化基准数据集,包含约 1,000 对人类面部图像,分辨率为 256×256,所有图像均来源于 FFHQ(Flickr-Faces-HQ) 数据集。
核心特性
- 标准化评估分桶:数据集将人脸对按照姿势难度、身份差异、年龄差距、性别等维度划分到 11 个评估桶中,便于分析算法在不同挑战场景下的表现。
- 信任级别分类:为每个人脸对分配信任级别(high / low_child / unreliable),标识身份相似度指标是否可靠,尤其针对儿童面部。
- 交互式可视化工具:提供基于浏览器的可视化界面,支持浏览、筛选、搜索和对比所有人脸对及其元数据。
- 零依赖可视化器:可视化器仅依赖 Python 标准库,无需额外安装包。
数据集结构
仓库目录结构如下:
faceswap-benchmark/ ├── benchmark_dataset/ │ ├── images/ # 约2000张JPG图像(命名格式:pair_XXXXXX_source.jpg / _target.jpg) │ ├── metadata/ │ │ └── pairs.csv # 主CSV文件,包含字段:pair_id, cos_sim, age, gender, yaw, tags, trust_level │ └── buckets/ # 每个评估桶对应一个.txt索引文件 │ ├── visualizer.py # 独立HTTP可视化器(仅使用标准库) ├── generate_buckets.py # 从原始FFHQ裁剪图像生成基准数据集 ├── generate_pairs.py # 通过FAISS近似最近邻搜索采样人脸对 ├── ffhq_extractor.py # 从原始FFHQ图像提取裁剪和嵌入 └── requirements.txt
评估桶(Evaluation Buckets)
| 桶名称 | 条件说明 | 测试目的 |
|---|---|---|
baseline |
正面、年龄相近、同性别 | 干净受控的换脸 |
identity_hard_adult |
双方成人,cos_sim < 0.20 | 身份保持能力 |
identity_hard_child |
至少一方≤12岁,cos_sim < 0.20 | 身份保持(儿童标记) |
identity_medium |
0.25 ≤ cos_sim < 0.50 | 中等身份难度 |
pose_moderate |
15° ≤ 偏航角差异 ≤ 45° | 几何扭曲 |
pose_extreme |
偏航角差异 > 45° | 严重几何压力 |
age_large |
年龄差异 > 20 岁 | 纹理/皮肤融合 |
age_moderate |
10 < 年龄差异 ≤ 20 岁 | 中等年龄融合 |
gender_same |
双方同性别 | 基线条件 |
gender_cross |
不同性别 | 跨性别融合 |
random |
所有配对 | 全池采样 |
信任级别(Trust Levels)
| 级别 | 条件 | 含义 |
|---|---|---|
high |
双方年龄 ≥ 18 岁 | 所有指标可靠 |
low_child |
至少一方年龄 < 18 岁 | 跳过身份相似度指标 |
unreliable |
儿童配对且 cos_sim < 0.15 | 仅用于几何/融合评估 |
数据生成流程
FFHQ图像 → InsightFace嵌入(ArcFace)→ FAISS配对生成与质量过滤 → 桶与信任级别分配 → 基准数据集生成 → 交互式UI可视化
交互式在线演示
您可以通过以下链接在线浏览基准数据集:
https://faceswap-benchmark.onrender.com
本地快速使用
无需GPU或额外包,克隆仓库后运行: bash git clone https://github.com/bhargavaa-g/faceswap-benchmark.git cd faceswap-benchmark python visualizer.py
然后在浏览器中打开 http://localhost:8500。
完整流水线重新生成(需GPU)
如需从原始FFHQ图像重新生成完整数据集,需具备CUDA GPU环境,并按照以下步骤执行: bash pip install -r requirements.txt python ffhq_extractor.py python generate_pairs.py python generate_buckets.py
未来工作
- 自动化指标流水线(SSIM、FID、ArcFace身份分数)
- 硬件基准测试(跨GPU推理速度)
- 面向换脸方法的客观排行榜集成
数据来源与贡献者
- 数据集来源:FFHQ(Flickr-Faces-HQ)数据集(NVIDIA)
- 面部嵌入计算:InsightFace(buffalo_l 模型)
- 贡献者:Bhargava G 和 Badarinath S Kini




