AGHI-QA

Name: AGHI-QA
Creator: 上海交通大学图像通信与网络工程研究所
Published: 2025-04-30 12:36:56
License: 暂无描述

arXiv2025-04-30 更新2025-05-13 收录

下载链接：

http://arxiv.org/abs/2504.21308v1

下载链接

链接失效反馈

官方服务：

资源简介：

AGHI-QA是一个针对AI生成的人像图像质量评估的大规模数据集，包含4000张由10种最先进的文本到图像模型生成的图像。数据集由400个精心设计的文本提示驱动，每个图像都标注有感知质量分数、文本-图像对应分数和可见的以及扭曲的人体部位标签。AGHI-QA为评估现有客观质量评估指标在AI生成的人像图像上的有效性提供了一个宝贵的测试平台。

AGHI-QA is a large-scale dataset for AI-generated portrait image quality assessment, containing 4,000 images generated by 10 state-of-the-art text-to-image models. The dataset is driven by 400 meticulously designed text prompts, and each image is annotated with perceptual quality scores, text-image alignment scores, and labels of visible and distorted human body parts. AGHI-QA provides a valuable testbed for evaluating the effectiveness of existing objective quality assessment metrics on AI-generated portrait images.

提供机构：

上海交通大学图像通信与网络工程研究所

创建时间：

2025-04-30

搜集汇总

数据集介绍

构建方式

AGHI-QA数据集的构建基于10种先进的文本到图像生成模型，通过400个精心设计的文本提示生成了4000张AI生成的人类图像。这些文本提示涵盖了人类外观、动作和场景的多样化组合，确保了数据集的广泛覆盖性。在主观研究中，邀请了23名参与者对每张图像进行了多维度标注，包括感知质量评分、文本-图像对应评分以及可见和扭曲的身体部位标签。数据集的构建严格遵循科学实验流程，确保了标注的可靠性和一致性。

特点

AGHI-QA数据集是首个专注于AI生成人类图像质量评估的大规模基准数据集，具有多维度的标注信息。其特点包括：1) 包含了感知质量和文本-图像对应性两种评分维度；2) 提供了详细的可见和扭曲身体部位标签，支持细粒度的语义分析；3) 涵盖了多种文本提示组合和场景，确保了数据集的多样性和代表性；4) 所有评分均采用平均意见分数(MOS)表示，保证了评估的客观性。这些特点使其成为评估AI生成人类图像质量的理想测试平台。

使用方法

AGHI-QA数据集可用于评估和改进文本到图像生成模型在人类图像生成方面的性能。研究人员可以：1) 使用该数据集训练和验证新的图像质量评估算法；2) 分析不同生成模型在人类图像合成中的优缺点；3) 开发针对人类身体部位扭曲检测的专门算法。此外，基于该数据集提出的AGHI-Assessor方法展示了如何将大型多模态模型应用于AI生成图像的质量评估，为相关研究提供了参考框架。数据集的多维度标注也支持更全面的图像质量分析。

背景与挑战

背景概述

AGHI-QA是由上海交通大学的研究团队于2025年提出的首个专注于AI生成人类图像质量评估的大规模基准数据集。该数据集包含10种前沿文本到图像生成模型基于400组精心设计的文本提示生成的4,000幅图像，每幅图像均标注了感知质量分数、文本-图像对应分数以及可见/扭曲人体部位标签。该研究针对当前生成模型在合成复杂人体结构时普遍存在的解剖学失真和纹理异常问题，填补了传统图像质量评估方法在细粒度人体图像分析方面的空白。通过系统性的主观实验设计，AGHI-QA为评估生成式AI在人类图像合成领域的性能提供了多维度的量化标准，对推动医疗影像合成、数字人创作等应用的发展具有重要意义。

当前挑战

AGHI-QA数据集面临的核心挑战体现在两个维度：在领域问题层面，需解决现有评估方法对生成式人类图像特有的解剖结构失真（如多指、关节错位）和语义一致性（如文本-图像对齐）的量化难题；在构建过程中，挑战包括：1)设计覆盖多样化人体姿态、场景和属性的文本提示体系；2)建立可靠的多维度标注框架以捕捉感知质量、语义对应和局部解剖失真等复杂特征；3)处理不同生成模型输出间的风格差异性导致的评估标准统一性问题。此外，标注过程中需克服主观评价对细微解剖错误的敏感度差异，确保标注结果具有临床可信度。

常用场景

经典使用场景

AGHI-QA数据集专为评估AI生成人类图像的质量而设计，广泛应用于文本到图像生成模型的性能测试和优化。该数据集通过多维度的主观评估，包括感知质量评分、文本-图像对应评分以及可见和扭曲人体部位的标注，为研究者提供了一个全面的基准测试平台。在计算机视觉领域，AGHI-QA被用于验证和比较不同文本到图像生成模型在生成人类图像时的表现，特别是在处理复杂人体结构和纹理时的能力。

解决学术问题

AGHI-QA数据集解决了AI生成人类图像质量评估中的多个关键学术问题。首先，它填补了现有图像质量评估方法在人类图像上的不足，这些方法通常仅提供全局质量评分，而无法捕捉人体结构的细微失真。其次，该数据集通过系统的主观研究和多维度的标注，为研究者提供了丰富的质量评估数据，支持对AI生成人类图像的感知质量和文本-图像对应关系的深入研究。此外，AGHI-QA还推动了针对人类图像质量评估的新方法和指标的发展，如提出的AGHI-Assessor模型。

衍生相关工作

AGHI-QA数据集已经衍生出多项相关研究工作。其中最突出的是AGHI-Assessor，这是一个基于大型多模态模型的质量评估方法，能够预测感知质量评分、文本-图像对应评分以及识别可见和扭曲的人体部位。此外，该数据集还激发了其他研究者开发针对AI生成人类图像的新评估指标和方法。例如，一些研究开始探索如何利用AGHI-QA的数据来训练更高效的深度学习模型，以自动检测和纠正生成图像中的人体结构失真。这些工作进一步推动了AI生成图像质量评估领域的发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集