five

PERSONA

收藏
arXiv2025-02-03 更新2025-02-11 收录
下载链接:
https://github.com/gobunu/OSDHuman
下载链接
链接失效反馈
官方服务:
资源简介:
PERSONA数据集是由上海交通大学提出的高质量人体图像数据集,通过自动化裁剪和过滤管道(HQ-ACF)从现有对象检测数据集和其他未标记图像中筛选出高质量的人体图像。该数据集包含了训练集、验证集和测试集,总计109,052张512×512像素的高清人体图像。PERSONA数据集在质量和内容丰富度上都超过了其他与人类相关数据集,为人体图像复原任务提供了一个新的基准。

The PERSONA dataset is a high-quality human body image dataset proposed by Shanghai Jiao Tong University. It is constructed by screening high-quality human body images from existing object detection datasets and other unlabeled images via an automated cropping and filtering pipeline (HQ-ACF). This dataset includes training, validation, and test splits, containing a total of 109,052 high-definition human body images with a resolution of 512×512 pixels. The PERSONA dataset outperforms other human-related datasets in terms of both quality and content richness, providing a new benchmark for human image restoration tasks.
提供机构:
上海交通大学
创建时间:
2025-02-03
搜集汇总
数据集介绍
main_image_url
构建方式
PERSONA数据集的构建方式是通过一个名为HQACF(High-Quality Dataset Automated Cropping and Filtering)的自动化流程实现的。首先,从现有的对象检测数据集中收集包含人体图像的数据,然后使用YOLO11模型进行人体检测,并应用Laplacian操作来过滤模糊图像。接下来,对检测到的人体边界框进行调整和裁剪,并使用无参考图像质量评估(IQA)指标进行筛选,最终得到高质量的人体图像数据集。这种方法确保了数据集的质量和内容的丰富性。
特点
PERSONA数据集的特点在于其高质量的图像和丰富的内容。该数据集包含了109,052张512x512像素的高质量人体图像,覆盖了广泛的场景和自然活动,平均每张图像包含3.4154个人。此外,该数据集在无参考IQA指标方面表现出色,超越了其他人体相关数据集。这使得PERSONA数据集成为人体恢复任务的一个理想基准。
使用方法
PERSONA数据集的使用方法包括训练、验证和测试。在训练阶段,可以使用该数据集来训练人体恢复模型,如OSDHuman。在验证和测试阶段,可以使用该数据集来评估模型的性能。此外,该数据集也可以用于其他人体相关任务,如人体姿态估计和3D重建。
背景与挑战
背景概述
人体恢复技术作为图像恢复领域的一个重要应用,在实际应用中广泛使用,并在各个领域发挥着重要作用。然而,由于缺乏基准数据集,对其进行深入研究仍然困难。本研究提出了一种高质量数据集自动裁剪和过滤(HQACF)流程。该流程利用现有的目标检测数据集和其他未标记图像自动裁剪和过滤高质量人体图像。使用此流程,我们构建了一个人体恢复数据集,包含复杂物体和自然活动(PERSONA),包括训练集、验证集和测试集。该数据集在质量和内容丰富度方面显著优于其他人体相关数据集。最后,我们提出了OSDHuman,一种用于人体恢复的新型一步扩散模型。具体而言,我们提出了一种高保真图像嵌入器(HFIE)作为提示生成器,以更好地引导模型使用低质量人体图像信息,有效地避免误导性提示。实验结果表明,OSDHuman在视觉质量和定量指标方面均优于现有方法。数据集和代码可在https://github.com/gobunu/OSDHuman上获取。
当前挑战
人体恢复技术面临的挑战包括:1) 人体恢复领域缺乏专门的基准数据集;2) 现有数据集往往缺乏专门的质量过滤,包含大量低质量样本;3) 人体图像往往涉及多人互动,增加了恢复任务的复杂性;4) 人体恢复模型需要在足够高质量的数据集上进行训练,以避免模型权重偏差。
常用场景
经典使用场景
在人体图像恢复领域,PERSONA数据集被广泛应用于训练和评估各种人体图像恢复模型。这些模型旨在从低质量的人体图像中恢复出高质量图像,以解决现实世界中图像采集和传输过程中常见的模糊、噪声、分辨率降低和JPEG伪影等问题。PERSONA数据集提供了大量高质量的人体图像,涵盖了各种自然活动和复杂的场景,使得模型能够学习到更全面的人体特征和细节,从而提高恢复图像的质量和真实性。
衍生相关工作
PERSONA数据集的提出推动了人体图像恢复领域的研究,衍生了许多相关的经典工作。例如,基于PERSONA数据集,研究人员提出了OSDHuman模型,这是一种一步扩散模型,专门用于人体图像恢复。OSDHuman模型采用了高保真图像嵌入器(HFIE)作为提示生成器,能够有效地从低质量的人体图像中提取出高保真的提示信息,从而提高恢复图像的质量和真实性。此外,PERSONA数据集还可以用于其他人体图像处理任务的研究,例如人体姿态估计、人体物体交互检测和3D重建等。
数据集最近研究
最新研究方向
针对人体图像恢复的挑战,特别是由于缺乏基准数据集而导致的困难,本研究提出了一种高质量数据集自动裁剪和过滤(HQACF)流程。利用现有的目标检测数据集和其他未标记的图像,该流程自动裁剪和过滤高质量的人体图像。通过这种方式,我们构建了一个基于人物的具有复杂物体和自然活动的人体图像恢复数据集(PERSONA),包括训练、验证和测试集。该数据集在质量和内容丰富度方面显著优于其他人体相关数据集。最后,我们提出了一种新颖的单步扩散模型OSDHuman用于人体图像恢复。具体来说,我们提出了一种高保真图像嵌入器(HFIE)作为提示生成器,以更好地引导模型使用低质量人体图像信息,有效地避免了误导性提示。实验结果表明,OSDHuman在视觉质量和定量指标方面都优于现有方法。该数据集和代码可在https://github.com/gobunu/OSDHuman上获得。
相关研究论文
  • 1
    Human Body Restoration with One-Step Diffusion Model and A New Benchmark上海交通大学 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作