StyleID

Name: StyleID
Creator: 韩国科学技术院
Published: 2026-04-23 21:55:22
License: 暂无描述

arXiv2026-04-23 更新2026-04-25 收录

下载链接：

https://arxiv.org/abs/2604.21689v1

下载链接

链接失效反馈

官方服务：

资源简介：

StyleID是由韩国科学技术院团队构建的面向人脸风格化身份识别的感知数据集，包含StyleBench-H和StyleBench-S两个子集。其中StyleBench-H是基于人类判断的基准数据集，包含3,551条经过严格筛选的样本，覆盖多种风格强度和艺术类型；StyleBench-S则是通过心理测量学实验生成的大规模合成监督集。数据来源于FFHQ人脸数据集，经过IP-Adapter等三种先进风格化方法处理，并采集了70名参与者的感知判断。该数据集旨在解决风格化人脸的身份一致性评估问题，为跨风格的身份识别模型提供人类感知对齐的监督信号。

StyleID is a perceptual dataset developed by the Korea Advanced Institute of Science and Technology (KAIST) team for face stylization-based identity recognition, which contains two subsets: StyleBench-H and StyleBench-S. StyleBench-H is a human-judged benchmark dataset with 3,551 strictly screened samples covering diverse style intensities and art genres; StyleBench-S is a large-scale synthetic supervised dataset generated through psychometric experiments. The dataset is sourced from the FFHQ face dataset, processed by three advanced stylization methods including IP-Adapter, and collected perceptual judgments from 70 participants. This dataset aims to address the issue of identity consistency evaluation for stylized faces, providing human-perception-aligned supervision signals for cross-style identity recognition models.

提供机构：

韩国科学技术院

创建时间：

2026-04-23

原始信息汇总

数据集概述：StyleID

基于您提供的页面内容，以下是对该数据集的详细总结：

1. 基本信息

名称: StyleID
全称: StyleID: A Perception-Aware Dataset and Metric for Stylization-Agnostic Facial Identity Recognition（一种面向风格化不可知的人脸身份识别的感知感知数据集与度量）
所属论文: StyleID: A Perception-Aware Dataset and Metric for Stylization-Agnostic Facial Identity Recognition
作者: Kwan Yun, Changmin Lee, Ayeong Jeong, Youngseo Kim, Seungmi Lee, Junyong Noh
发布时间: 2026年4月23日（v1版本）
发布地点: SIGGRAPH 2026 / ACM TOG
学科分类: 计算机科学 - 图形学 (cs.GR)；同时涉及计算机视觉与模式识别 (cs.CV)、人机交互 (cs.HC)、多媒体 (cs.MM)

2. 数据集核心组成

该数据集包含两个子集，旨在解决创意面部风格化（如卡通、素描、绘画）中身份识别鲁棒性差的问题：

子集名称	类型	描述
StyleBench-H	基准测试 (Benchmark)	捕捉人类在扩散模型和流匹配模型驱动的多种风格化强度下，进行“相同-不同”身份验证判断的感知数据。
StyleBench-S	监督集 (Supervision Set)	通过心理测量学的二选一强迫选择实验，获得识别强度曲线，用于模型校准。

3. 数据集用途

评估框架: 提供一种风格不可知的评估框架，用于衡量面部风格化后的身份一致性。
模型校准: 利用 StyleBench-S 对现有语义编码器进行微调，使其相似度排序结果与人类感知对齐，从而提高跨风格和跨强度的人脸身份识别鲁棒性。
实验验证: 经校准的模型在与人类判断的相关性以及域外（如艺术家绘制肖像）的鲁棒性上表现出显著提升。

4. 可用性

数据集、代码和预训练模型均公开可用（页面中提及提供公开链接）。

5. 关联信息

论文链接: https://arxiv.org/abs/2604.21689 (即原始页面)
项目主页: 该页面提供的链接（具体URL未在文本中完整展示，但提及“Project page at this https URL”）。

搜集汇总

数据集介绍

构建方式

StyleID数据集的构建以人为感知为核心，包含两个子集。StyleBench-H子集从FFHQ中筛选高质量肖像，经由IP-Adapter、InstantID和InfiniteYou三种扩散或流匹配方法，在7个强度等级和10种艺术风格下生成配对图像，并招募70名受试者进行同异身份验证，经一致性筛选后获得3551个有效数据点。StyleBench-S子集则基于二项强制选择实验获取的识别强度曲线，在人类识别概率高于90%的强度等级上选择正样本对，为每位身份生成55张风格化图像，总计约224k样本，形成大规模合成监督集。

特点

StyleID数据集的核心特点在于其感知感知与风格无关性。StyleBench-H提供了跨风格、跨方法及跨身份的分割，能够严格评估模型对未见风格和方法的泛化能力。StyleBench-S通过心理测量曲线实现了对风格化强度的精细校准，确保合成数据与人类感知高度一致。数据集覆盖了多变艺术风格与强度梯度，并明确考量了不同风格化框架（如IP-Adapter与InstantID）在身份保留上的异质性，为训练对风格鲁棒的身份编码器提供了结构化监督信号。

使用方法

StyleID的使用方法分为评估与训练两大场景。评估时可利用StyleBench-H及其跨风格、跨方法分割，通过计算真阳性率、验证准确率及AUC等指标，量化身份编码器与人类判断的一致性。训练时则基于StyleBench-S，以CLIP-L为骨干网络，注入LoRA适配器，结合ArcFace角度边界损失、监督对比损失和嵌入正则化损失进行微调，获得风格鲁棒的身份表示。此外，数据集与预训练模型均已公开，可便捷地替换现有风格化流程中的身份损失函数，提升下游任务中身份保留的稳健性。

背景与挑战

背景概述

StyleID数据集由韩国科学技术院（KAIST）的Kwan Yun、Changmin Lee、Ayeong Jeong、Youngseo Kim、Seungmi Lee与Junyong Noh等研究人员于2026年提出，旨在解决创意人脸风格化中身份识别可靠性不足的核心问题。随着扩散模型与流匹配技术在肖像风格化领域的广泛应用，现有身份编码器因过度依赖自然照片域训练数据，在卡通、素描、绘画等多样化视觉风格下表现脆弱，常将纹理或色彩变化误判为身份漂移，或无法察觉几何夸张导致的身份损失。StyleID通过构建人类感知感知的评估框架，首次将人为判断置于风格无关身份一致性测量的中心，填补了该领域缺乏系统性基准与校准监督的空白，对推动风格化人脸识别、个性化虚拟形象及多模态语言模型中的身份保真度研究具有重要影响力。

当前挑战

StyleID面临的挑战首先在于领域问题层面：现有身份编码器在风格化场景下与人类感知严重脱节，缺乏能跨方法、跨强度稳定衡量身份一致性的风格无关指标——这导致开发者无法科学比较不同风格化管线的身份保留能力，研究者也缺乏锚定于人类判断的监督信号。其次，构建过程极具挑战性：需在多种风格方法和强度下收集大量人类同/异身份验证判断，同时通过二择一强迫选择实验推导出心理测量识别强度曲线，以生成与人类感知校准的大规模合成数据集StyleBench-S。此外，如何设计可控风格化管线以精确调制强度、如何确保跨不同人口统计属性与艺术风格的基准公平性、以及如何平衡人类标注成本与数据规模，均是构建此数据集时需克服的显著难题。

常用场景

经典使用场景

StyleID数据集的核心应用场景在于评估与提升创意面部风格化中的身份保持能力。面对卡通、素描、油画等多样化视觉风格转换，传统身份编码器因训练于自然照片而表现脆弱，常将纹理或色彩变化误判为身份漂移。StyleID通过构建StyleBench-H人类感知基准和StyleBench-S合成监督集，提供了一个风格无关的评估框架，用于衡量不同风格化方法及强度下的身份一致性，尤其适用于需在强烈外观变化下保持可识别性的个性化头像、虚拟形象生成等任务。

衍生相关工作

StyleID催生了多项拓展性工作，包括轻量级变体StyleID_small和StyleID_tiny，分别实现4倍和20倍的计算开销缩减，拓展了其在资源受限场景的部署可能。此外，其监督集构建范式被后续研究用于改进风格化面部识别模型（如StylizedFace的校准优化），并启发了融合人类感知与合成数据的混合训练策略。相关实验还论证了基于CLIP的大容量骨干网络在风格化身份保持中的优越性，为后续探索多模态、大语言模型驱动的鲁棒面部表征学习提供了数据与方法基础。

数据集最近研究