five

FaceSkin

收藏
arXiv2023-08-09 更新2024-07-24 收录
下载链接:
https://drive.google.com/file/d/1V4eCXlH7NXxsGxiw27o9FWlvYsx2IL8i/view
下载链接
链接失效反馈
官方服务:
资源简介:
FaceSkin是由招商银行AI实验室创建的大规模人脸皮肤斑点数据集,旨在为深度学习提供隐私保护的分类任务数据。该数据集包含多样化的年龄和种族信息,并引入了合成皮肤斑点,来源于2D和3D攻击图像,如打印纸、重放和3D面具,以扩展应用场景。数据集的创建过程中,使用了Mediapipe进行面部标志定位,提取纯皮肤斑点,并通过DeepFace进行属性标注,如年龄、种族和性别。FaceSkin的应用领域包括人脸反欺诈和年龄估计,旨在解决人脸图像隐私保护和属性分类的需求。

FaceSkin is a large-scale facial skin lesion dataset created by the AI Lab of China Merchants Bank, aiming to provide privacy-preserving classification task data for deep learning. This dataset contains diverse age and ethnicity information, and introduces synthetic skin lesions sourced from 2D and 3D attack images such as printed paper, replay attacks and 3D masks to expand application scenarios. During the dataset construction process, Mediapipe was used for facial landmark localization to extract pure skin lesions, and attributes including age, ethnicity and gender were annotated via DeepFace. The application fields of FaceSkin cover face anti-fraud and age estimation, which is designed to address the requirements of facial image privacy protection and attribute classification.
提供机构:
招商银行AI实验室
创建时间:
2023-08-09
搜集汇总
数据集介绍
main_image_url
构建方式
在计算机视觉领域,面部皮肤图像因其丰富的纹理信息而成为年龄、种族和性别等属性分类的宝贵特征。FaceSkin数据集的构建始于从Celeb-HQ数据集中筛选正面人脸图像,以确保图像归一化。随后,利用Mediapipe工具获取面部关键点,精确定位并提取脸颊和额头区域的纯净皮肤斑块,从而分离皮肤纹理与面部结构。为弥补原始数据中种族和年龄分布的不均衡,研究团队从AFAD数据集中补充了亚洲人脸图像,并从CelebA-Spoof数据集中引入包括打印攻击、重放攻击和3D面具在内的多种欺骗攻击图像,以扩展数据集的场景覆盖。每个皮肤斑块均通过DeepFace模型进行属性标注,最终形成包含真实性、性别、年龄和种族等多维标签的大规模数据集。
特点
FaceSkin数据集的核心特点在于其专注于面部皮肤斑块,这一设计巧妙平衡了生物特征表示与隐私保护的需求。数据集涵盖了多样化的种族与年龄群体,并通过引入合成欺骗图像,增强了在活体检测等下游任务中的适用性。其标注体系全面,每个样本均附有真实性、性别、年龄和种族四类属性,为多任务学习提供了坚实基础。此外,数据集的构建注重质量与多样性,所有图像均经过高分辨率筛选和正面姿态过滤,确保了数据的清晰度与一致性。这些特征使得FaceSkin不仅适用于基础的属性分类研究,还能有效支持人脸反欺骗、年龄估计等前沿应用的探索与验证。
使用方法
FaceSkin数据集的使用方法主要围绕其多属性分类任务展开。研究人员可依据具体目标,如年龄估计、种族识别、性别分类或活体检测,从数据集中选取相应的皮肤斑块图像及其标注信息进行模型训练。在实验设计上,可采用ResNet、MobileNet等主流卷积神经网络作为基准模型,通过交叉熵损失函数和随机梯度下降优化器进行端到端训练。对于年龄和种族等收敛困难的属性,论文建议采用双分支网络架构,同时输入原始人像与提取的皮肤斑块,通过特征融合提升模型表征能力。数据集已按属性进行平衡处理,用户可直接用于训练与评估,亦可根据需要进一步划分训练集、验证集和测试集,以验证模型在隐私保护场景下的泛化性能与鲁棒性。
背景与挑战
背景概述
在深度学习技术蓬勃发展的背景下,人脸图像分析领域对大规模标注数据的需求日益迫切,然而公众隐私意识的提升使得人脸数据收集面临严峻挑战。FaceSkin数据集由招商银行AI实验室的郭秋实与廖诗莎于2023年构建,其核心研究问题在于探索如何利用面部皮肤纹理作为隐私友好的生物特征替代品,以支持年龄、种族、性别等多属性分类任务。该数据集通过提取Celeb-HQ与Celeb-Spoof等公开数据集中的面部皮肤区域,构建了涵盖真实与合成攻击图像的皮肤贴片集合,不仅为属性识别提供了新的数据范式,亦在人脸反欺诈与年龄估计等下游任务中展现出潜在应用价值,推动了隐私保护与计算机视觉研究的交叉融合。
当前挑战
FaceSkin数据集致力于解决面部多属性分类这一核心领域问题,其挑战在于皮肤纹理的特征表达具有高度细微性与个体差异性,且易受光照、妆容等外部因素干扰,导致模型在跨场景泛化时性能波动。在构建过程中,研究人员面临数据源分布不均的难题,例如原始Celeb-HQ数据集中种族与年龄类别存在显著偏差,需通过重采样与外部数据补充以平衡样本。此外,从人脸图像中精准分离纯净皮肤区域依赖面部关键点检测技术,任何定位误差均可能引入非皮肤纹理噪声,而合成攻击图像的多样性整合亦对数据标注的一致性与质量提出了更高要求。
常用场景
经典使用场景
在计算机视觉与生物识别领域,FaceSkin数据集以其独特的隐私保护特性,为面部皮肤纹理分析提供了经典应用场景。该数据集通过提取纯面部皮肤斑块,有效替代完整人脸图像,广泛应用于年龄、种族、性别等多属性分类任务。其设计巧妙平衡了数据可用性与隐私安全,成为深度学习模型训练中验证皮肤纹理表征能力的基准工具,尤其在需要规避隐私风险的研究环境中展现出显著价值。
实际应用
在实际应用中,FaceSkin数据集为金融安全、身份验证系统提供了关键技术支撑。例如,在银行或移动支付场景中,基于皮肤纹理的活体检测可有效防御打印攻击、重放攻击及3D面具欺诈,增强系统安全性。同时,该数据集支持的年龄与性别估计功能,亦可用于个性化服务推荐或医疗健康监测,如皮肤疾病辅助诊断。其隐私保护特性更符合日益严格的数据监管要求,助力企业部署合规的生物识别解决方案。
衍生相关工作
FaceSkin数据集的发布催生了多项衍生研究,尤其在多模态特征融合与轻量化模型设计方面取得进展。例如,研究者受其启发,开发了双分支神经网络架构,结合肖像图像与皮肤斑块特征以提升属性分类精度。此外,该数据集为活体检测领域提供了新的纹理分析基准,促进了基于材质反射特性的反欺诈算法创新。相关成果进一步拓展至跨域皮肤分析,如结合HAM10000等医学数据集,探索皮肤纹理在健康诊断中的泛化能力。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作