Multiface

Name: Multiface
Creator: Meta Reality Labs Research
Published: 2023-06-27 01:43:18
License: 暂无描述

arXiv2023-06-27 更新2024-06-21 收录

下载链接：

https://github.com/facebookresearch/multiface

下载链接

链接失效反馈

官方服务：

资源简介：

Multiface是由Meta Reality Labs Research创建的一个多视角、高分辨率的人脸数据集，旨在支持神经人脸渲染的研究。该数据集通过大型多摄像头设备Mugsy捕捉了13个身份的高保真面部表情，每个身份有超过一百种面部表情，分辨率达到4096×2668像素。数据集不仅包括图像，还有跟踪的网格、未包装的纹理、相机校准和音频数据。Multiface数据集的应用领域主要集中在VR远程呈现技术中，旨在解决高质量数据的可访问性问题，并推动研究在虚拟现实中实现更真实的面部渲染和重建。

Multiface is a multi-view, high-resolution facial dataset created by Meta Reality Labs Research, aiming to support research on neural face rendering. This dataset captures high-fidelity facial expressions of 13 identities using the large-scale multi-camera rig Mugsy. Each identity has over one hundred facial expressions, with a resolution of 4096×2668 pixels. The dataset includes not only images but also tracked meshes, unwrapped textures, camera calibrations and audio data. The application domains of the Multiface dataset mainly focus on VR telepresence technologies, with the goals of addressing the accessibility issue of high-quality data and advancing research on more realistic facial rendering and reconstruction in virtual reality.

提供机构：

Meta Reality Labs Research

创建时间：

2022-07-23

搜集汇总

数据集介绍

构建方式

在神经人脸渲染领域，高质量多视角数据的稀缺长期制约着研究进展。Multiface数据集通过Meta Reality Labs Research构建的Mugsy多相机捕捉系统实现，该系统采用球形排列的40至160台同步相机，以4096×2668原始分辨率捕捉13位参与者的面部表演。数据采集涵盖峰值表情、视线运动及语音平衡句子，通过并行Patchmatch重建、模型无关网格跟踪及个性化关键点检测等流程，生成包含原始图像、拓扑一致网格、展开纹理及相机标定在内的多模态数据，为高保真面部建模提供了坚实基础。

使用方法

该数据集支持端到端的神经人脸渲染模型训练，尤其适用于条件变分自编码器架构。研究人员可利用提供的训练代码，将网格与平均纹理编码至潜空间，并通过视角条件解码生成视图依赖纹理。训练过程中可采用屏幕空间损失函数，结合前景掩膜与区域加权策略优化眼部、嘴部等重点区域的重建质量。数据集支持新颖视角合成、新颖表情合成及两者联合的泛化能力评估，其分划的相机集合与表情子集便于进行系统性消融实验，推动面部重建技术在虚拟现实等领域的应用发展。

背景与挑战

背景概述

随着虚拟现实与实时远程呈现技术的迅猛发展，高保真面部渲染与重建成为实现沉浸式社交体验的核心挑战。2023年，Meta Reality Labs Research团队在CVPR研讨会上发布了Multiface数据集，旨在填补学术界在高质量多视角面部数据方面的空白。该数据集由13位参与者构成，通过名为Mugsy的大型多相机捕捉装置，以高达4096×2668的分辨率同步记录丰富的面部表情与几何信息。其核心研究问题聚焦于神经面部渲染，特别是新颖视角与表情的合成，为Codec Avatar等虚拟化身技术的研发提供了前所未有的数据支持，显著推动了人脸建模领域向更高真实感与泛化能力迈进。

当前挑战

Multiface数据集致力于解决神经面部渲染中的两大核心挑战：新颖视角合成与新颖表情合成。由于实际捕捉中无法覆盖所有可能的相机位置与面部动作，模型必须从有限样本中学习高维空间的连续映射，这对网络架构的泛化能力提出了极高要求。在构建过程中，团队面临多相机同步校准、高分辨率数据处理的巨大计算开销，以及从原始图像到纹理映射的复杂追踪流程等工程难题。此外，数据集的规模与质量虽显著超越前代如HUMBI与FaceWarehouse，但如何有效建模高频细节如皮肤毛孔与细微皱纹，仍是当前技术亟待突破的瓶颈。

常用场景

经典使用场景

在神经渲染与三维人脸重建领域，Multiface数据集为研究者提供了前所未有的高精度多视角人脸数据。该数据集最经典的应用场景在于训练能够合成新颖视角与表情的神经渲染模型。通过其密集的相机阵列捕获的高分辨率同步视频，模型得以学习人脸在多种表情下的细微几何与纹理变化，从而实现从有限视角到任意视角、从有限表情到连续表情的高保真插值与生成。这一过程是构建具有高度真实感与表现力的数字化身（Codec Avatar）的核心技术路径。

解决学术问题

Multiface数据集有效解决了三维人脸建模中长期存在的若干关键学术难题。首先，它通过提供前所未有的高分辨率（2048×1334像素）与多视角（最高150个视角）数据，极大地缓解了现有数据集（如HUMBI、FaceWarehouse）在细节捕捉上的不足，使得模型能够学习并重建皮肤毛孔、细微皱纹等高频细节。其次，其丰富的表情序列（最高118种）为研究表情的连续空间插值（novel expression synthesis）提供了坚实基础。最后，数据集配套的精确相机标定与跟踪网格，为研究视角依赖的外观效应（view-dependent effects）和几何-纹理联合优化提供了可靠的监督信号，推动了从传统网格渲染到神经渲染的范式转变。

实际应用

Multiface数据集的实际应用紧密围绕虚拟现实（VR）中的实时远程呈现（telepresence）技术。基于该数据集训练的神经化身模型，能够驱动用户在虚拟环境中的高保真数字替身，实现自然、沉浸式的面对面交流。这种应用对于社交VR、远程协作、娱乐及心理健康治疗等领域具有变革性意义。此外，该数据集也为电影与游戏产业中高性能数字角色的创建提供了高质量的数据源与基准，使得生成具有丰富微表情和真实感外观的虚拟角色成为可能，从而跨越“恐怖谷”效应，提升用户体验。

数据集最近研究