IDFACEIQA
收藏Hugging Face2026-05-04 更新2026-05-05 收录
下载链接:
https://huggingface.co/datasets/aleizb/IDFACEIQA
下载链接
链接失效反馈官方服务:
资源简介:
IDCFIQA 是一个专为身份一致性人脸图像生成质量评估设计的基准数据集。该数据集旨在解决当前缺乏专门评估身份一致性人脸生成算法质量的基准的问题。数据集包含 200 张源人脸图像(100 张来自 AgeDB 的真实人脸和 100 张由 ThisPersonDoesNotExist 生成的合成人脸)以及由 8 种代表性生成算法产生的 1,600 张生成人脸图像。通过主观成对标注和 Bradley-Terry 模型,数据集提供了两个关键维度的评估:感知质量和身份一致性。数据集共收集了 84,000 个有效的人类投票。IDCFIQA 适用于评估身份一致性人脸生成算法的性能,分析视觉质量与身份保真度之间的权衡,以及开发新的生成人脸图像质量评估指标。数据集的使用应限于研究和评估目的,不推荐用于人脸识别、生物特征识别或监控等场景。
IDCFIQA is a benchmark dataset specifically designed for identity-consistent face image generation quality assessment. The dataset aims to address the current lack of benchmarks dedicated to evaluating the quality of identity-consistent face generation algorithms. It contains 200 source face images (100 real faces from AgeDB and 100 synthetic faces generated by ThisPersonDoesNotExist) and 1,600 generated face images produced by 8 representative generation algorithms. Through subjective pairwise annotations and the Bradley-Terry model, the dataset provides evaluations on two key dimensions: perceptual quality and identity consistency. A total of 84,000 valid human votes were collected. IDCFIQA is suitable for assessing the performance of identity-consistent face generation algorithms, analyzing the trade-off between visual quality and identity fidelity, and developing new quality assessment metrics for generated face images. The use of the dataset should be limited to research and evaluation purposes and is not recommended for scenarios such as face recognition, biometric identification, or surveillance.
创建时间:
2026-04-26
原始信息汇总
IDCFIQA 数据集详情
数据集概述
IDCFIQA 是一个针对身份一致人脸图像生成的质量评估基准数据集。该数据集包含 200 张源人脸图像和 1,600 张生成人脸图像,由八种代表性生成算法生成。
| 项目 | 描述 |
|---|---|
| 数据集名称 | IDCFIQA |
| 任务类型 | 身份一致人脸图像生成质量评估 |
| 图像总数 | 1,800 张 |
| 源图像 | 200 张(100 张真实人脸 + 100 张合成人脸) |
| 真实源图像 | 来自 AgeDB 的 100 张图像 |
| 合成源图像 | 由 ThisPersonDoesNotExist 生成的 100 张图像 |
| 生成图像 | 1,600 张 |
| 生成方法 | 8 种代表性身份一致人脸生成算法 |
| 评估维度 | 感知质量 和 身份一致性 |
| 标注方式 | 人工成对比较 |
| 分数估计 | Bradley-Terry (B-T) 模型 |
| 人工投票 | 84,000 次有效成对投票 |
评估维度
- 感知质量 (Perceptual Quality):生成人脸图像的视觉质量
- 身份一致性 (ID Consistency):生成图像与对应源图像之间的身份保真度
数据来源与构成
- 真实源图像:从公开的 AgeDB 数据库中手动选取 100 张高质量图像
- 合成源图像:使用 ThisPersonDoesNotExist 生成 100 张合成身份图像
- 生成算法:IPA-FaceID-Plus、IPA-FaceID-Plus V2、Arc2Face、FastComposer、InstantID、IPA-FaceID (SDXL)、PhotoMaker、AlvPai 共八种方法
- 生成提示词:统一使用 "a photo of a person"
数据标注
- 参与者:150 名本科生和研究生(年龄 18-30 岁,视力正常或矫正正常)
- 标注协议:成对比较,展示同一源图像由不同算法生成的两张图像,由参与者选择更优的一张
- 质量遵循:ITU-R BT.500-14 推荐标准,在受控显示条件下进行
使用限制与建议
有效使用场景
- 对身份一致人脸生成的图像质量评估方法进行基准测试
- 比较身份保持的人脸生成算法
- 分析视觉质量与身份保真度之间的权衡
- 开发针对生成人脸图像的新图像质量评估指标
不推荐的场景
- 通用人脸识别训练
- 生物特征识别
- 监控用途
- 人口统计分类
- 安全敏感的身份验证
- 非人脸图像生成模型评估
数据偏差说明
- 仅包含 200 个源身份,某些人口群体、年龄段、面部外观和成像条件可能代表性不足
- 标注者均为 18-30 岁的学生,可能引入标注者人口统计偏差
- 八种生成算法在真实子集与合成子集上的表现存在差异
敏感信息
数据集包含人脸图像,可能属于生物特征和敏感个人信息,可能隐含或编码以下属性:
- 表观年龄
- 性别呈现
- 肤色
- 种族相关外貌
- 其他面部特征
建议仅在研究限制下发布和使用,禁止用于监控、生物特征识别或恶意身份操纵。
下载链接
- 百度网盘:https://pan.baidu.com/s/1COe-R4kTm6C1-V7aq3kGvw?pwd=dd8j (密码:dd8j)
- Google Drive:https://drive.google.com/drive/folders/1YOv7jCwPeyZPtT63EXjw2NK-m6-RqHWH?usp=sharing
许可协议
CC BY-NC-SA 4.0
搜集汇总
数据集介绍

构建方式
IDCFIQA数据集专为身份一致性人脸图像生成的质量评估而构建,其设计理念源于对现有生成方法缺乏统一评估基准的深刻洞察。该数据集精心选取了200张源人脸图像,其中100张源自AgeDB数据库的真实人脸,另100张由ThisPersonDoesNotExist生成的合成人脸,并采用八种代表性的身份一致性人脸生成算法对每张源图像进行生成,最终得到1600张生成图像。为全面评估生成效果,研究团队组织了150名受试者进行成对比较的主观注释,累计获得84000个有效投票,并利用Bradley-Terry模型将成对比较结果转化为两项关键维度的量化分数:感知质量与身份一致性。
特点
IDCFIQA数据集的独特之处在于其双维度评估框架,能够同时衡量生成图像的视觉感知质量与身份保真度,突破了传统单一质量评价的局限。数据集融合了真实与合成源图像,覆盖了多种生成算法的输出,为算法比较提供了丰富的对抗性样本。此外,8.4万个成对投票确保了主观分数的高可靠性,而Bradley-Terry模型的引入将离散偏好转化为连续评分,提升了评估的统计严谨性。数据集还通过ITU-R BT.500-14标准控制实验条件,减少了环境噪声对注释质量的影响。
使用方法
IDCFIQA数据集可直接用于评估现有图像质量评估方法在身份一致人脸生成任务中的表现,使用前需从百度网盘或Google Drive下载完整数据包。研究者可将数据集作为基准,比较不同生成算法在感知质量和身份一致性上的优劣,或分析现有IQA模型的局限性。使用时需注意,数据集仅限研究用途,不可用于人脸识别、生物特征验证或监控等场景。代码与数据捆绑发布,支持直接调用预处理后的图像与Bradley-Terry分数,便于快速开展实验。对于希望开发新质量评估指标的团队,该数据集提供了标准化的测试床。
背景与挑战
背景概述
身份一致性人脸图像生成技术在虚拟现实、影视制作及数字人像等领域具有广阔应用前景,然而现有生成方法的快速发展却因缺乏专门的质量评估基准而难以进行公平比较,进而制约了该领域的技术进步。为填补这一空白,研究团队于近年构建了IDCFIQA数据集,该数据集包含200张源人脸图像(分别来自AgeDB的真实人脸与ThisPersonDoesNotExist生成的合成人脸)及由8种代表性生成算法产生的1600张生成图像,通过人类成对比较与Bradley-Terry模型获取感知质量与身份保真度双维度评分。该工作由面向生成图像质量评估的研究人员主导,其核心贡献在于为身份一致性人脸生成任务建立了首个标准化的评估标杆,有力推动了该领域的可量化研究。
当前挑战
IDCFIQA所解决的领域核心挑战在于身份一致性人脸生成缺乏客观、统一的评估体系,不同算法往往仅凭视觉印象或下游任务表现被粗略比较,难以精准衡量其在视觉质量与身份保真度双维度下的真实性能。数据集构建过程中亦面临多重困难:源图像需兼顾真实与合成场景下的多样性,但200个身份样本难以覆盖全部人口统计学特征与复杂成像条件;主观注释环节虽招募150名年轻参与者并执行标准化实验流程,但注释者年龄及文化背景的局限性可能引入偏差;此外,8种生成算法在不同子集上的表现差异,以及统一文本提示所带来的语义多样性限制,均对数据集的可推广性构成挑战。
常用场景
经典使用场景
IDCFIQA数据集专为评估身份一致性人脸图像生成的质量而构建,其经典使用场景聚焦于综合衡量生成图像的两个核心维度:感知质量与身份一致性。该数据集包含200张源图像与1600张生成图像,覆盖多种主流生成算法。研究者可借此基准,通过人类成对比较标注与Bradley-Terry模型得分,系统评估不同生成方法在视觉自然度与身份保持能力上的表现,从而为生成算法的公平比较提供标准化平台。
实际应用
在实际应用中,IDCFIQA可服务于数字娱乐、影视制作、虚拟主播及个性化社交等领域,帮助开发者筛选和优化高保真度的人脸生成系统。例如,在电影特效中,该数据集可用于验证换脸算法的身份一致性,避免因生成缺陷导致角色辨识度下降。同时,在虚拟现实交互场景下,它可作为质量监控工具,确保合成人像在视觉自然度与身份可信度之间取得最佳平衡,提升用户体验的真实感与沉浸感。
衍生相关工作
该数据集的出现催生了一系列衍生研究,包括开发面向生成人脸图像的新型图像质量评估指标、探索感知质量与身份一致性协同优化的生成策略,以及分析不同源图像类型(真实与合成)对生成算法表现的差异性影响。此外,基于IDCFIQA的双维标注数据,研究者可进一步训练可预测身份保真度的深度学习模型,推动无参考质量评估技术在生物特征感知领域的突破,为更广泛的人脸生成基准构建奠定方法论基础。
以上内容由遇见数据集搜集并总结生成



