BodyRealism

arXiv2024-12-05 更新2024-12-11 收录

下载链接：

http://arxiv.org/abs/2412.04086v1

下载链接

链接失效反馈

官方服务：

资源简介：

BodyRealism是由亚马逊团队创建的一个专注于人体真实性的数据集，包含约30,000张生成的和真实的图像，这些图像与多模态信号（如文本描述、高质量的人体真实性评分和3D人体表示）配对。数据集的创建过程包括使用SOTA模型生成图像，并通过专家注释者进行人体真实性评分。BodyRealism旨在解决文本到图像生成模型中人体真实性评估的问题，特别是在生成图像中人体特征的真实性评估。

BodyRealism is a dataset focused on human body realism created by the Amazon team. It contains approximately 30,000 generated and real images paired with multimodal signals including text descriptions, high-quality human body realism scores, and 3D human body representations. The dataset construction process involves using SOTA models to generate images, followed by human body realism scoring by expert annotators. BodyRealism aims to address the problem of human body realism evaluation in text-to-image generation models, particularly the realism assessment of human body features in generated images.

提供机构：

亚马逊

创建时间：

2024-12-05

搜集汇总

数据集介绍

构建方式

BodyRealism数据集通过精心设计的标注流程构建，旨在评估文本生成图像中人体真实性。该数据集包含约30,000张生成和真实图像，每张图像附带多模态信号，包括文本描述、专家标注的体现实分数以及3D人体表示。生成图像通过使用当前最先进的文本生成图像模型（如Stable Diffusion）生成，并结合负向提示词以减少模型偏差。标注过程由专家执行，使用1-10的评分标准，确保对图像中人体真实性的准确评估。此外，数据集还包含从MS COCO中筛选的真实人体图像，以平衡生成图像的偏差。

特点

BodyRealism数据集的显著特点在于其专注于人体真实性的评估，而非整体图像质量。数据集不仅包含生成图像，还涵盖了真实图像，确保了多样性和广泛性。每张图像都附带详细的体现实分数和3D人体表示，这些多模态信息为模型提供了丰富的监督信号。此外，数据集的标注由专家执行，确保了评分的准确性和一致性。通过这些特点，BodyRealism为评估和改进文本生成图像模型中的人体真实性提供了强有力的支持。

使用方法

BodyRealism数据集主要用于训练和评估专门针对人体真实性的可学习指标BodyMetric。研究人员可以通过该数据集训练模型，使其能够识别和量化生成图像中的人体不真实性。具体使用方法包括：首先，利用数据集中的图像和多模态信号进行模型训练；其次，通过BodyMetric对生成图像进行评分，评估其人体真实性；最后，利用BodyMetric对不同文本生成图像模型进行基准测试，比较其在生成真实人体图像方面的性能。此外，数据集还可用于研究人体真实性相关的图像生成技术，推动该领域的进一步发展。

背景与挑战

背景概述

BodyRealism数据集由Amazon的研究团队于2024年创建，旨在解决文本到图像生成模型中人体真实性评估的难题。该数据集的核心研究问题是如何通过自动化的方式评估生成图像中人体结构的真实性，减少对人工评估的依赖。BodyRealism包含了约30,000张生成和真实图像，每张图像都附带了文本描述、人体真实性评分以及3D人体表示。该数据集的创建不仅推动了文本到图像生成领域的研究，还为生成模型的性能评估提供了新的基准。

当前挑战

BodyRealism数据集面临的挑战主要集中在两个方面。首先，生成图像中常见的人体结构失真问题，如多余或缺失的肢体、不自然的姿势等，这些问题在现有评估方法中难以被准确捕捉。其次，数据集构建过程中，如何高效且准确地标注人体真实性评分是一个重大挑战。尽管通过专家标注和3D人体模型辅助，数据集的质量得到了提升，但仍需进一步优化标注流程以应对多样化的生成模型和复杂的文本提示。

常用场景

经典使用场景

BodyRealism数据集的经典使用场景主要集中在文本到图像生成模型的评估与优化。该数据集通过提供丰富的多模态信号，包括文本描述、高质量的身体真实性评分以及3D身体表示，帮助研究人员评估生成图像中人体部分的真实性。通过BodyMetric这一可学习的指标，研究人员能够系统地分析和比较不同生成模型在生成逼真人体图像方面的表现，从而推动文本到图像生成技术的发展。

解决学术问题

BodyRealism数据集解决了文本到图像生成领域中长期存在的挑战，即如何准确评估生成图像中人体部分的真实性。传统的评估方法依赖于耗时的人工判断，难以在大规模模型评估中应用。BodyRealism通过引入BodyMetric，利用3D人体模型和多模态信号，自动评估生成图像中的人体真实性，显著提高了评估效率和准确性，为生成模型的基准测试提供了新的工具。

衍生相关工作

BodyRealism数据集的提出催生了一系列相关研究工作，特别是在文本到图像生成和虚拟人领域。基于BodyMetric的评估方法，研究人员开发了多种改进的生成模型，旨在提升生成图像中人体部分的逼真度。此外，该数据集还启发了对多模态数据融合和3D人体模型在图像生成中的应用研究，推动了生成模型在复杂场景下的表现优化。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集