five

VTON-QBench

收藏
arXiv2026-03-13 更新2026-03-17 收录
下载链接:
https://github.com/litelightlite/VTON-IQA
下载链接
链接失效反馈
官方服务:
资源简介:
VTON-QBench是由ZOZO研究院与庆应义塾大学联合构建的大规模虚拟试穿图像质量评估数据集,包含14种代表性模型生成的62,688张试穿图像及431,800条经过严格筛选的人类标注数据。数据集通过合成服装-人物对增强技术扩展原始数据多样性,并采用两阶段标注清洗流程确保数据可靠性。其核心价值在于为无参考图像质量评估任务提供人类感知对齐的标注基准,可广泛应用于电子商务虚拟试穿系统的质量优化研究。

VTON-QBench is a large-scale virtual try-on image quality assessment dataset jointly constructed by ZOZO Research Institute and Keio University. It contains 62,688 try-on images generated by 14 representative models and 431,800 rigorously screened human annotation data. The dataset expands the diversity of original data through synthetic clothing-person pair augmentation techniques, and adopts a two-stage annotation cleaning pipeline to ensure data reliability. Its core value lies in providing a human perception-aligned annotation benchmark for no-reference image quality assessment tasks, which can be widely applied to quality optimization research of e-commerce virtual try-on systems.
提供机构:
ZOZO研究院; ZOZO公司; 庆应义塾大学
创建时间:
2026-03-13
原始信息汇总

VTON-IQA数据集概述

数据集名称

VTON-IQA

数据集来源

该数据集托管于GitHub平台,项目地址为:https://github.com/litelightlite/VTON-IQA

搜集汇总
数据集介绍
main_image_url
构建方式
在虚拟试穿领域,评估生成图像的质量面临缺乏真实参考图像的挑战。VTON-QBench的构建采用系统性流程,首先基于VITON-HD和Dress Code测试集,通过FLUX.1-dev模型合成多样化服装-人物对以扩展数据规模,覆盖休闲、街头、正式等多种时尚风格。随后利用14种代表性虚拟试穿模型生成62,688张试穿图像,并通过众包平台收集431,800条质量标注。为确保标注可靠性,设计了两阶段数据清洗流程,包括使用明确答案的虚拟任务进行筛选,并基于Krippendorff's α系数剔除低一致性标注,最终保留13,838名合格标注者的高质量反馈。
特点
该数据集的核心特点在于其规模与标注质量的双重优势。作为当前虚拟试穿领域最大规模的人类主观评估基准,它涵盖了多种模型生成的广泛试穿样本,确保了评估的全面性与代表性。数据集的标注体系采用三级有序尺度,从“不自然”到“完全自然”,并引入参考图像辅助标注者判断服装长度一致性,从而提升评估的准确性。此外,通过严格的标注者筛选与数据清洗机制,显著提高了标注间的一致性,使得数据集能够可靠地反映人类对试穿图像质量的感知判断,为模型训练提供了稳健的监督信号。
使用方法
VTON-QBench主要用于训练与评估无参考的虚拟试穿图像质量评估模型,如VTON-IQA。研究人员可将数据集划分为训练、验证与测试集,利用其提供的服装图像、人物图像、生成试穿图像及对应的人类质量评分,训练模型预测与人类感知对齐的质量分数。该数据集支持对14种虚拟试穿模型进行系统化基准测试,在配对与未配对设置下评估生成质量。在实际应用中,训练好的质量评估模型可替代大规模用户研究,为虚拟试穿系统的开发与优化提供高效、可复现的评价标准,推动该领域的标准化进程。
背景与挑战
背景概述
VTON-QBench数据集由ZOZO Research、ZOZO Inc.与庆应义塾大学的研究团队于2026年构建,旨在解决虚拟试穿(VTON)领域中的图像质量评估难题。随着VTON技术在时尚电商等实际应用中的重要性日益凸显,其生成图像的质量评估成为关键挑战。传统基于参考图像的评估方法在真实场景中因缺乏真实试穿图像而难以适用,而分布级指标如Fréchet Inception Distance又无法反映单张生成图像的感知质量。VTON-QBench通过大规模人类标注,提供了62,688张由14种代表性VTON模型生成的试穿图像及431,800条质量标注,为开发无参考、人类对齐的质量评估框架奠定了数据基础,推动了VTON评估的标准化与可重复性研究。
当前挑战
VTON-QBench面临的挑战主要体现在两个方面:在领域问题层面,虚拟试穿质量评估需同时验证服装保真度与人物细节保留,这要求模型能够建模生成图像与输入服装、人物图像间的复杂交互关系,而传统单图像质量评估方法难以捕捉此类跨图像依赖。在构建过程层面,数据集的创建需克服大规模人类标注中的可靠性问题,包括标注者注意力不集中或恶意响应带来的变异性,为此研究团队设计了专门的数据筛选流程,通过一致性评估与不可靠标注者排除,确保标注质量;同时,为增强时尚多样性,数据集通过合成服装-人物对进行扩充,但合成过程可能引入属性不一致性,需结合自动过滤与专家手动检查以维持视觉合理性。
常用场景
经典使用场景
在虚拟试穿领域,VTON-QBench数据集最经典的使用场景是作为大规模人类感知标注基准,用于训练和评估无参考图像质量评估模型。该数据集汇集了14种代表性虚拟试穿模型生成的62,688张试穿图像,并包含来自13,838名合格标注者的431,800条质量标注。这些数据通过精心设计的众包流程和严格的数据筛选机制,确保了标注的可靠性和一致性。研究者和开发者利用该数据集,能够系统地分析不同虚拟试穿模型在服装保真度、人物细节保留等方面的性能差异,从而推动模型优化与比较研究。
衍生相关工作
VTON-QBench数据集衍生了一系列重要的研究工作,其中最突出的是VTON-IQA框架的提出。该框架利用数据集中的人类标注,设计了交错交叉注意力模块,显式建模试穿图像与输入服装、人物图像之间的交互关系,实现了与人类感知高度一致的无参考质量评估。此外,该数据集还支撑了对14种代表性虚拟试穿模型的全面基准评估,揭示了专有图像编辑模型在人类对齐质量方面的优势。这些工作不仅推动了虚拟试穿质量评估方法的发展,也为后续研究提供了可扩展的评估范式,激励了更多关于多模态交互建模和感知对齐的探索。
数据集最近研究
最新研究方向
在虚拟试穿领域,VTON-QBench数据集的推出标志着无参考图像质量评估研究迈入新阶段。该数据集通过大规模人类标注构建了包含62,688张试穿图像与431,800条质量标注的基准,为模型评估提供了可靠的人类感知对齐标准。当前研究热点聚焦于开发能够模拟人类跨图像交互判断的评估框架,如VTON-IQA所采用的交错交叉注意力模块,该模块通过显式建模试穿图像与输入服装、人物图像间的关联,有效捕捉服装保真度与非目标区域保留等关键质量维度。这一进展不仅解决了传统分布级指标在个体图像感知质量评估上的局限性,更为虚拟试穿系统的标准化评测与性能优化提供了可扩展的解决方案,推动了该领域从生成技术向可信评估体系的纵深发展。
相关研究论文
  • 1
    Reference-Free Image Quality Assessment for Virtual Try-On via Human FeedbackZOZO研究院; ZOZO公司; 庆应义塾大学 · 2026年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作