HumanRefiner

Hugging Face2024-07-11 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/Enderfga/HumanRefiner

下载链接

链接失效反馈

官方服务：

资源简介：

HumanRefiner数据集是一个大规模的基准，专注于人体解剖异常的生成与精炼。该数据集包含56K合成的人体图像，每张图像标注了147K人体异常，分为18个不同类别。数据集支持从粗到细的人体异常精炼方法的研究。

创建时间：

2024-07-05

原始信息汇总

HumanRefiner 数据集概述

数据集介绍

HumanRefiner 数据集是一个专注于人体解剖异常的大型基准数据集，名为 AbHuman。该数据集包含 56,000 张合成的人体图像，每张图像都标注了 147,000 个人体异常，涵盖 18 个不同的类别。

数据集下载

数据集可通过以下命令下载： bash git lfs install git clone https://huggingface.co/datasets/Enderfga/HumanRefiner

下载后，提取训练和验证数据集： bash tar -xzf train.zip tar -xzf val.zip

标注示例

数据集提供了详细的类别定义和可视化示例，展示了不同类别的人体异常。

引用

如在研究中使用该数据集，请引用以下论文： bibtex @misc{fang2024humanrefinerbenchmarkingabnormalhuman, title={HumanRefiner: Benchmarking Abnormal Human Generation and Refining with Coarse-to-fine Pose-Reversible Guidance}, author={Guian Fang and Wenbiao Yan and Yuanfan Guo and Jianhua Han and Zutao Jiang and Hang Xu and Shengcai Liao and Xiaodan Liang}, year={2024}, eprint={2407.06937}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2407.06937}, }

搜集汇总

数据集介绍

构建方式

HumanRefiner数据集的构建基于AbHuman基准，该基准专注于解剖学异常的大规模合成人类图像。数据集包含56K张合成的人类图像，每张图像均标注了147K个18个不同类别的人类异常。这些异常通过详细的边界框级别标签进行标注，确保了数据的精确性和多样性。数据集的构建过程结合了文本到图像扩散模型的技术，旨在解决现有模型在生成人类图像时常见的肢体扭曲等问题。

特点

HumanRefiner数据集的特点在于其专注于人类解剖学异常的识别与修正。数据集不仅提供了丰富的合成人类图像，还通过详细的异常标注，使得研究者能够深入分析人类图像生成中的常见问题。此外，数据集还引入了HumanRefiner方法，该方法通过从粗到细的姿势可逆引导，显著提升了人类图像生成的质量，特别是在肢体质量方面，相较于现有技术有显著改进。

使用方法

使用HumanRefiner数据集时，用户可以通过Hugging Face平台下载数据集。下载后，用户需解压训练集和验证集，以便进行模型训练和验证。数据集的使用方法包括利用其标注信息进行异常检测和修正，以及结合HumanRefiner方法进行图像生成优化。通过这种方式，用户可以在文本到图像生成任务中，显著提升生成图像的质量，特别是在人类图像的生成方面。

背景与挑战

背景概述

HumanRefiner数据集由Guian Fang等研究人员于2025年提出，旨在解决文本到图像生成领域中人类图像生成的质量问题。该数据集包含56,000张合成的人类图像，每张图像标注了147,000个人体异常，涵盖18个不同类别。这些异常主要涉及人体解剖学上的错误，如肢体扭曲等。HumanRefiner的提出不仅为相关领域提供了首个大规模的人体异常基准，还引入了一种新颖的插拔式方法，用于从粗到细的异常修正。该数据集的研究成果已在ECCV 2024会议上发表，对提升文本到图像生成模型在人类图像生成中的准确性具有重要影响。

当前挑战

HumanRefiner数据集面临的挑战主要体现在两个方面。首先，在领域问题方面，文本到图像生成模型在处理人类图像时，往往难以准确生成复杂的解剖结构，导致肢体扭曲等异常现象。尽管现有模型在图像生成方面取得了显著进展，但在人类图像生成中的表现仍不尽如人意。其次，在数据集构建过程中，研究人员需要克服合成图像的真实性与多样性之间的平衡问题，同时确保标注的准确性和一致性。此外，如何设计有效的插拔式方法，以实现从粗到细的异常修正，也是构建过程中的一大挑战。这些挑战的解决不仅需要大量的计算资源，还依赖于对生成模型的深入理解与优化。

常用场景

经典使用场景

HumanRefiner数据集在文本到图像生成领域具有重要应用，特别是在生成具有解剖学异常的人类图像时。该数据集通过提供56K合成人类图像和147K详细标注的异常类别，为研究人员提供了一个基准，用于评估和改进生成模型在人体解剖学准确性方面的表现。经典的使用场景包括通过该数据集训练和验证模型，以生成更符合解剖学标准的人类图像。

实际应用

在实际应用中，HumanRefiner数据集被广泛用于改进文本到图像生成模型，特别是在需要生成高质量人类图像的场景中，如虚拟现实、游戏开发和医学图像生成。通过该数据集，开发者能够训练出更精确的生成模型，减少图像中的解剖学错误，从而提升用户体验和图像的真实感。

衍生相关工作

HumanRefiner数据集衍生了一系列相关研究工作，特别是在解剖学异常检测和图像生成优化领域。基于该数据集，研究人员提出了多种改进生成模型的方法，如HumanRefiner插件，该方法通过自诊断程序检测和纠正粗粒度和细粒度的异常，显著提升了生成图像的质量。这些工作不仅推动了生成模型的技术进步，还为相关领域的研究提供了新的思路和工具。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集