PPR10K
收藏arXiv2021-05-19 更新2024-06-21 收录
下载链接:
https://github.com/csjliang/PPR10K
下载链接
链接失效反馈官方服务:
资源简介:
PPR10K是一个大规模的人像照片润饰数据集,由香港理工大学和阿里巴巴达摩院共同创建。该数据集包含11,161张高质量的原始人像照片,分为1,681个组,每组照片由三位专家精心调整,确保组内色调一致。数据集不仅提供高分辨率的人区域分割掩码,还强调人区域优先和组级别一致性,适用于自动人像照片润饰方法的研究。PPR10K旨在解决传统人像照片润饰中的人工劳动密集和效率低下的问题,通过提供丰富的数据和客观评价标准,推动自动人像润饰技术的发展。
PPR10K is a large-scale portrait photo retouching dataset jointly created by The Hong Kong Polytechnic University and Alibaba DAMO Academy. The dataset contains 11,161 high-quality raw portrait photos divided into 1,681 groups, with each group meticulously adjusted by three experts to ensure consistent color tone within the group. Besides providing high-resolution human region segmentation masks, the dataset highlights human region priority and group-level consistency, making it suitable for research on automatic portrait photo retouching methods. PPR10K aims to address the issues of labor-intensive work and low efficiency in traditional portrait photo retouching, and promotes the advancement of automatic portrait retouching technology by offering abundant data and objective evaluation criteria.
提供机构:
香港理工大学, 阿里巴巴达摩院
创建时间:
2021-05-19
搜集汇总
数据集介绍

构建方式
PPR10K数据集的构建,首先是通过与个人摄影师和专业摄影工作室协商,购买了大量高质量的原始人像照片,并从提供原始格式人像照片的付费材料网站上购买了照片。在数据收集过程中,精心控制了原始照片在拍摄目的、人物主题、背景场景、照明条件以及相机设备使用方面的多样性。随后,对收集到的照片进行了多轮筛选,最终选择了11,161张人像照片,分为1,681组。每组照片包含3至18张在相同场景连续时间拍摄的相同主题的照片。为了获得高质量的地面真实数据,雇佣了3位具有丰富专业摄影行业经验的专家独立地对原始照片进行了调整,使用Photoshop中的CameraRaw。每位修图师都根据其领域知识,将原始照片调整到符合专业人像摄影工作室输出标准的结果,主要要求是:首先,每张照片应调整到对普通人的感知来说是视觉上令人愉悦的,特别是对人像区域。其次,一组照片应调整到具有一致的色调。修图师被允许在CameraRaw中调整任何操作,而无需更改内容或引入几何失真。此外,还要求每位专家的修图风格在类似场景中保持自我一致性,这对于学习稳定且鲁棒的修图模型非常重要。我们还雇佣了另一位专家对修图结果进行双重检查,并进行了几轮反馈和修复,以确保地面真实数据的高质量。考虑到人像照片中人物区域的高优先级及其复杂的照明,我们还为每张照片提供了人像区域掩码,以便更好地学习修图模型。为了节省注释成本,掩码首先使用内部开发的肖像分割算法生成,该算法在一组人像遮罩数据集上进行了训练,支持分割高达100兆像素的照片。然后,手动检查和细化了一些困难场景(如水下、极低光、玻璃反射和遮挡情况)上的失败案例。
特点
PPR10K数据集的主要特点是包含1,681组共计11,161张高质量原始人像照片。该数据集是第一个包含人像区域掩码和组级一致目标的大型人像照片修图数据集。每个原始照片都由三位专家独立调整,同时精心调整每组照片,以确保组级一致性。此外,数据集还提供了一组客观指标,用于评估自动PPR在HRP和GLC方面的性能,并提出了相应的学习策略来优化PPR模型。
使用方法
PPR10K数据集可用于研究自动人像照片修图方法。使用该数据集时,可以采用以下方法:1. 数据集准备:下载并解压PPR10K数据集,确保文件结构完整。2. 数据预处理:根据实验需要,对原始照片进行缩放、裁剪等预处理操作。3. 模型训练:使用数据集中的原始照片和修图结果,训练人像照片修图模型。4. 模型评估:使用数据集中的修图结果和客观指标,评估模型的修图性能。5. 模型优化:根据评估结果,调整模型结构和参数,优化修图效果。
背景与挑战
背景概述
肖像照片修饰(PPR)作为图像处理领域的一个重要分支,旨在提升一组平面肖像照片的视觉质量。与通用照片修饰任务不同,PPR具有其特殊且实用的要求,如人体区域优先(HRP)和组级一致性(GLC)。HRP要求在修饰过程中更加关注人体区域,而GLC要求一组肖像照片在色调上保持一致。然而,现有的通用照片修饰数据集和模型难以满足PPR的这些要求。为了促进这一高频任务的研究,研究人员构建了一个名为PPR10K的大规模PPR数据集,该数据集是目前为止已知的首个此类数据集。PPR10K包含了1,681组共计11,161张高质量的原始肖像照片,并提供了人体区域的高分辨率分割掩码。每张原始照片由三位专家进行修饰,并精心调整每组照片的色调以保持一致。此外,研究人员还提出了一系列客观指标来评估PPR的性能,并提出了相应的学习策略来提高PPR模型的人体区域优先和组级一致性表现。PPR10K数据集为研究自动PPR方法提供了一个良好的基准,实验结果表明,所提出的学习策略能够有效提高修饰性能。
当前挑战
PPR10K数据集在构建过程中面临了诸多挑战。首先,为了满足实际需求,数据集必须包含原始格式的高质量照片,但与易于获取的压缩JPG图像相比,原始照片在互联网上获取难度更大。其次,数据集需要大规模且涵盖广泛的实际案例,包括拍摄目的、人体、背景场景、光照条件和相机设备的使用,这进一步增加了数据收集的成本。第三,为了学习有效的PPR模型,需要提供高质量的修饰结果(既具有良好的视觉质量又具有组级一致性)和人体区域掩码,这使得标注过程既昂贵又繁琐。此外,PPR10K数据集的构建也带来了学习有效肖像修饰模型的新挑战。首先,原始照片和人体区域掩码的高分辨率(从4K到8K)要求修饰模型具有高效率。其次,各种场景内容和光照条件的多样性要求模型具有灵活性和内容适应性。第三,组级一致性的需求要求模型具有鲁棒性和稳定性,这对于实际应用至关重要。
常用场景
经典使用场景
PPR10K数据集主要用于研究肖像照片的自动修图技术。该数据集包含了11,161张高质量的原生肖像照片,这些照片被分为1,681组,每组照片都由三位专业摄影师进行修图,并确保了组内照片的色调一致性。此外,该数据集还为每张照片提供了高分辨率的人体区域分割掩码,有助于模型更好地关注人体区域,从而提高修图效果。PPR10K数据集为研究自动肖像照片修图技术提供了一个宝贵的基准。
实际应用
PPR10K数据集在实际应用中可以用于开发自动肖像照片修图软件。该软件可以帮助摄影师快速地修图,从而提高工作效率。此外,PPR10K数据集还可以用于开发手机应用程序,帮助用户快速修图,从而提高用户体验。PPR10K数据集在实际应用中具有重要的价值。
衍生相关工作
PPR10K数据集的构建为肖像照片修图技术的研究提供了新的方向。基于PPR10K数据集,研究者可以设计更有效的学习策略,以提高模型的HRP和GLC性能。此外,PPR10K数据集还可以用于研究其他类型的照片修图任务,例如风景照片修图和人像照片修图。PPR10K数据集为照片修图技术的研究开辟了新的道路。
以上内容由遇见数据集搜集并总结生成



