RealOcc, RealOcc-Wild

Name: RealOcc, RealOcc-Wild
Creator: 南洋理工大学
Published: 2022-05-13 01:03:57
License: 暂无描述

arXiv2022-05-13 更新2024-06-21 收录

下载链接：

https://github.com/kennyvoo/faceocclusion-generation

下载链接

链接失效反馈

官方服务：

资源简介：

本研究介绍了两个高分辨率真实世界遮挡人脸数据集：RealOcc和RealOcc-Wild。RealOcc包含550张经过对齐和裁剪的人脸图像，而RealOcc-Wild则包含270张在野外拍摄的遮挡人脸图像，用于鲁棒性测试。这些数据集通过精细的手动标注，旨在解决人脸遮挡分割问题，为模型评估提供高质量数据。数据集的创建过程涉及从Pexels和Unsplash等网站收集图像，并进行手动标注和分类，以确保数据的准确性和多样性。这些数据集的应用领域包括人脸识别、面部重建等，特别是在处理遮挡情况下的性能提升。

This study introduces two high-resolution real-world occluded face datasets: RealOcc and RealOcc-Wild. RealOcc consists of 550 aligned and cropped face images, while RealOcc-Wild contains 270 occluded face images captured in the wild for robustness testing. These datasets, with elaborate manual annotations, are designed to address the face occlusion segmentation task and provide high-quality data for model evaluation. The dataset creation process involves collecting images from platforms such as Pexels and Unsplash, followed by manual annotation and categorization to ensure the accuracy and diversity of the data. The application scenarios of these datasets include face recognition, facial reconstruction and other fields, especially for improving model performance when dealing with occluded scenarios.

提供机构：

南洋理工大学

创建时间：

2022-05-13

搜集汇总

数据集介绍

构建方式

在面部遮挡分割研究领域，高质量标注数据的稀缺构成了显著挑战。RealOcc与RealOcc-Wild数据集的构建，源于对现有数据缺陷的系统性修正与创新性生成。研究团队以CelebAMask-HQ为基础，手动修正了约4000张存在错误标注的图像，并依据遮挡定义将数据集划分为遮挡与非遮挡类别。为进一步丰富数据，提出了自然遮挡生成与随机遮挡生成两种合成方法，前者通过色彩迁移、图像协调与超分辨率技术模拟真实遮挡，后者则叠加随机形状与纹理以增强多样性。最终，从Pexels与Unsplash收集高分辨率真实世界图像，经严格对齐裁剪与野外环境保留，形成了包含精细标注的评估数据集。

特点

该数据集的核心特征体现在其高质量与场景多样性。RealOcc包含550张经过精确对齐与裁剪的高分辨率遮挡面部图像，确保了数据的规整性与可比性；而RealOcc-Wild则收录了270张未经裁剪的野外环境图像，专为模型鲁棒性测试设计，模拟了真实应用中的复杂场景。数据标注遵循严谨的类别定义，明确区分面部皮肤与各类遮挡物，并对透明物体等灰色区域进行了专门处理。其标注精细度显著超越了以往数据集，有效解决了标注错误与类别模糊问题，为遮挡感知任务提供了可靠的基准。

使用方法

在模型训练与评估实践中，该数据集展现了明确的应用路径。研究者可将合成生成的NatOcc与RandOcc数据集用于训练深度分割模型，以模拟大量真实遮挡情况并提升模型泛化能力。对于模型性能的客观评估，则需使用RealOcc与RealOcc-Wild作为验证集与测试集，其中对齐版本用于标准性能比较，野外版本用于鲁棒性分析。使用时应遵循论文定义的评估指标，如平均交并比，并注意结合非遮挡测试集以全面衡量模型性能。数据集的划分与类别定义已在原论文中详细说明，为复现研究与横向比较提供了清晰框架。

背景与挑战

背景概述

在计算机视觉领域，面部遮挡感知分割作为一项关键任务，对于人脸识别、面部交换及面部重建等下游应用具有重要价值。然而，真实世界遮挡面部数据的采集与标注过程耗时费力，现有数据集往往存在数量有限、分辨率低下或标注不准确等问题。为此，南洋理工大学S-Lab的研究团队于近年提出了RealOcc与RealOcc-Wild数据集，旨在通过高质量合成数据生成技术，如自然遮挡生成与随机遮挡生成方法，推动遮挡感知面部分割研究的发展。该数据集的创建不仅弥补了真实遮挡数据稀缺的不足，还为模型评估提供了精细标注的高分辨率真实世界遮挡面部图像，显著提升了相关任务的鲁棒性与泛化能力。

当前挑战

在遮挡感知面部分割领域，核心挑战在于如何准确区分面部与遮挡物，尤其是在复杂自然场景下，遮挡物的多样性、透明度及与面部颜色的相似性增加了分割难度。构建RealOcc与RealOcc-Wild数据集过程中，研究人员面临多重挑战：一是真实遮挡数据标注的复杂性，需手动修正CelebAMask-HQ数据集中约4000张错误标注图像；二是合成数据自然性的实现，需通过色彩迁移、图像协调与超分辨率等技术提升合成遮挡物的视觉真实性；三是数据泛化能力的保障，要求合成方法能够处理未见过的遮挡类型及野外环境下的面部图像。此外，透明或半透明遮挡物的模拟以及类别不平衡问题也对数据集的构建与模型评估提出了更高要求。

常用场景

经典使用场景

在面部感知计算领域，RealOcc与RealOcc-Wild数据集为遮挡感知的面部分割任务提供了关键的评估基准。该数据集通过提供高分辨率、精细标注的真实世界遮挡面部图像，成为验证和比较各类分割模型性能的经典场景。研究者通常利用RealOcc（经过对齐与裁剪）评估模型在受控环境下的分割精度，而RealOcc-Wild（野外环境）则用于测试模型在复杂、未对齐场景中的鲁棒性，二者共同构成了一个全面且严谨的评估体系。

实际应用

在实际应用层面，基于RealOcc数据集训练或评估的模型，能够显著提升诸多面部相关技术在现实场景中的性能。例如，在需要高精度面部提取的人脸识别系统中，该数据集有助于开发对眼镜、口罩、手部等常见遮挡物具有鲁棒性的分割模块，从而改善识别准确率。在面部交换、三维面部重建等视觉任务中，精确的遮挡分割是确保合成结果自然、重建模型完整的前提。此外，在安防、人机交互、内容创作等领域，该数据集也为开发适应复杂真实环境的智能面部处理工具提供了重要数据基础。

衍生相关工作

该数据集的发布催生并支撑了一系列围绕遮挡面部理解的衍生研究。其提供的基准评估框架，促使研究者开发更先进的自然合成数据生成方法，以弥补真实数据收集的困难。同时，基于该数据集验证的分割模型架构（如PSPNet、DeepLabv3+、SegFormer等）的性能对比分析，为模型设计提供了新的见解。相关工作进一步探索了如何将高质量的遮挡分割结果，作为前置模块集成到更广泛的下游任务中，例如提升遮挡情况下的人脸识别、面部属性编辑以及视频会议中的虚拟背景替换等应用的性能与可靠性。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集