five

FaceQ|面部生成数据集|AI评估数据集

收藏
arXiv2024-12-18 更新2024-12-19 收录
面部生成
AI评估
下载链接:
http://arxiv.org/abs/2412.13155v1
下载链接
链接失效反馈
资源简介:
FaceQ是由上海交通大学和Bilibili公司联合创建的一个大规模AI生成面部图像数据库,包含12255张由29个模型生成的面部图像,涵盖面部生成、定制和修复三个任务。该数据集包含32742个多维度的平均意见分数(MOS),由180名标注者评估,涵盖质量、真实性、身份保真度和文本图像对应性等多个维度。数据集的创建过程包括多样化的源数据收集、模型生成图像、人工标注等多个步骤。FaceQ数据集主要用于评估和比较面部生成、定制和修复模型的性能,旨在解决当前AI生成面部图像在真实性和身份保真度方面的问题。
提供机构:
上海交通大学
创建时间:
2024-12-18
AI搜集汇总
数据集介绍
main_image_url
构建方式
FaceQ数据集的构建过程分为三个主要任务:人脸生成、人脸定制和人脸修复。首先,通过设计288个面向人脸的提示词,涵盖了从一般描述到具体面部属性的多种类别,生成了4032张人脸图像。其次,利用35个身份参考图像和20个提示词,通过6种代表性模型进行人脸定制,生成了4200张定制人脸图像。最后,通过合成和真实世界的低质量图像,使用9种先进的修复模型生成了4023张修复后的人脸图像。所有图像均经过180名参与者的多维度主观评估,涵盖质量、真实性、身份保真度和文本图像对应性等维度。
特点
FaceQ数据集的显著特点在于其大规模、多维度和细粒度的质量标注。该数据集包含了12255张由29种生成模型生成的图像,涵盖了人脸生成、定制和修复三个任务。每张图像都经过32742个多维度的平均意见分数(MOS)评估,确保了数据集在质量、真实性、身份保真度和文本图像对应性等方面的全面性。此外,数据集的多样性体现在提示词的广泛覆盖和生成模型的多样性上,使其成为评估和比较不同生成模型性能的理想基准。
使用方法
FaceQ数据集可用于评估和比较不同人脸生成、定制和修复模型的性能。研究者可以通过分析模型在质量、真实性、身份保真度和文本图像对应性等维度的表现,来识别模型的优势和不足。此外,该数据集还可用于开发和验证新的图像质量评估(IQA)和人脸质量评估(FQA)方法,特别是针对AI生成内容的质量评估。通过对比现有评估方法与人类主观评分之间的相关性,研究者可以进一步优化和改进现有的评估指标,以更好地反映人类对AI生成人脸的感知和偏好。
背景与挑战
背景概述
近年来,生成式模型在内容创作领域取得了显著进展,尤其是在人脸图像生成、定制和修复方面。然而,当前的AI生成人脸(AIGFs)往往因独特的失真、不真实的细节和意外的身份变化而无法满足人类偏好,这凸显了建立一个全面的人脸质量评估框架的必要性。为此,上海交通大学和Bilibili公司联合推出了FaceQ数据集,该数据集包含12,255张由29种生成模型生成的图像,涵盖人脸生成、定制和修复三个任务。FaceQ数据集通过180名标注者的32,742个多维度平均意见分数(MOS),评估了图像的质量、真实性、身份保真度和文本图像对应性。FaceQ数据集的推出为评估和比较人脸生成、定制和修复模型提供了基准,揭示了现有图像质量评估方法在评估真实性和身份保真度方面的不足。
当前挑战
FaceQ数据集的构建面临多重挑战。首先,生成式模型在生成过程中容易出现独特的失真、不真实的细节和身份变化,这使得传统的图像质量评估方法难以准确评估AI生成的人脸图像。其次,数据集的构建过程中,如何确保生成的图像具有多样性、代表性,并且能够覆盖不同的任务(生成、定制和修复)是一个复杂的问题。此外,多维度的主观评估需要大量的标注工作,如何确保标注的一致性和可靠性也是一个挑战。最后,现有的图像质量评估方法在评估AI生成图像的真实性、身份保真度和文本图像对应性方面表现不佳,这为开发新的评估方法提出了更高的要求。
常用场景
经典使用场景
FaceQ数据集的经典使用场景主要集中在人脸生成、定制和修复任务的评估上。通过包含12,255张由29种不同生成模型生成的图像,FaceQ数据集为研究人员提供了一个全面的基准,用于评估这些模型在生成高质量、真实感人脸图像方面的表现。研究人员可以通过该数据集对不同模型在质量、真实性、身份保真度和文本图像对应性等多个维度上的表现进行细致的比较和分析。
解决学术问题
FaceQ数据集解决了当前AI生成人脸图像(AIGFs)在质量评估方面的常见学术问题。传统的图像质量评估方法往往无法准确捕捉AI生成图像中的独特失真、不真实细节和身份偏移等问题。FaceQ通过引入多维度的主观评分(如质量、真实性、身份保真度和文本图像对应性),为研究人员提供了一个系统化的框架,用于评估和改进AI生成人脸图像的质量,从而推动了该领域的研究进展。
衍生相关工作
FaceQ数据集的发布催生了一系列相关的经典工作,特别是在人脸生成、定制和修复模型的评估和改进方面。例如,基于FaceQ数据集的研究人员开发了新的图像质量评估方法,如MINTIQA,该方法在AI生成图像的质量评估中表现出色。此外,FaceQ还推动了对现有生成模型的深入分析,揭示了这些模型在不同任务中的优势和不足,从而为未来的模型优化提供了方向。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

红外谱图数据库

收集整理红外谱图实验手册等数据,建成了红外谱图数据库。本数据库收录了常见化合物的红外谱图。主要包括化合物数据和对应的红外谱图数据。其中,原始红外谱图都进行了数字化处理,从而使谱峰检索成为可能。用户可以在数据库中检索指定化合物的谱图,也可以提交谱图/谱峰数据,以检索与之相似的谱图数据,以协助进行谱图鉴定。

国家基础学科公共科学数据中心 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

中国行政区划数据

本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。

github 收录