IIITS MFace Dataset

Name: IIITS MFace Dataset
Creator: 印度信息技术学院
Published: 2019-03-28 09:03:01
License: 暂无描述

arXiv2019-03-28 更新2024-06-21 收录

下载链接：

https://sites.google.com/a/iiits.in/snehasis-mukherjee/datasets-1

下载链接

链接失效反馈

官方服务：

资源简介：

IIITS MFace Dataset是由印度信息技术学院创建的一个用于无约束环境下多面孔人脸识别的挑战性数据集。该数据集包含688张图像，涵盖了多种挑战，如姿态变化、遮挡、光照变化等。数据集通过多个移动设备摄像头捕捉，以模拟真实世界的人脸识别问题。数据集分为Gallery Set和Probe Set两部分，用于评估各种人脸描述符的性能。该数据集旨在解决无约束环境中的人脸识别问题，特别是在多面孔场景下的识别挑战。

The IIITS MFace Dataset is a challenging dataset developed by the Indian Institute of Information Technology for unconstrained multi-face recognition. It contains 688 images covering various challenges including pose variations, occlusions, lighting changes and others. Captured via multiple mobile device cameras to simulate real-world face recognition scenarios, the dataset is split into two subsets: the Gallery Set and the Probe Set, which are used to evaluate the performance of various face descriptors. This dataset aims to address face recognition problems in unconstrained environments, especially the recognition challenges in multi-face scenarios.

提供机构：

印度信息技术学院

创建时间：

2018-09-30

搜集汇总

数据集介绍

构建方式

在人脸识别领域，非受控环境下的多脸识别仍是一项极具挑战性的任务。为此，IIITS MFace数据集应运而生，旨在填补现有数据集在多人脸图像与复杂背景变化方面的空白。该数据集通过多部手机摄像头采集图像，以确保更贴近真实世界的应用场景。数据集分为Gallery集和Probe集两部分，共包含7名受试者。Gallery集由180张多人脸图像构成，每张图像包含3至5人，所有可见人脸被手动裁剪并标注，最终得到688张人脸图像。Probe集则包含365张单人人脸图像，每位受试者约50张，涵盖姿态、遮挡、光照、面具、眼镜等多种变化。

特点

IIITS MFace数据集的核心特点在于其极高的复杂性与多样性，远超现有基准数据集。图像中同时存在多人脸、非正面姿态、部分遮挡、面具、眼镜、表情变化及不均匀背景等多种挑战，且这些挑战常同时出现。与仅包含单一人脸的数据集相比，该数据集更真实地反映了现实场景中的识别难度。实验表明，即使是表现优异的VGGFace深度学习描述符，在该数据集上的最佳识别率也仅为69.39%，远低于其在其他数据集上的表现，充分验证了其作为挑战性基准的价值。

使用方法

该数据集适用于评估人脸检测与识别算法的鲁棒性。研究者可使用Gallery集作为参考库，Probe集作为查询集，采用基于局部描述符或深度学习的特征提取方法，通过最近邻分类器进行识别。数据集提供了每张人脸的裁剪版本及坐标信息，便于直接用于特征提取与检测验证。推荐使用Chi-square距离进行特征匹配，实验证明该距离度量在该数据集上表现最佳。该数据集仅限研究用途，可从官方页面公开获取。

背景与挑战

背景概述

人脸识别作为计算机视觉领域的核心议题，长期以来在受控环境中取得了显著进展。然而，非约束环境下的人脸识别，尤其是多脸同时出现时，仍面临严峻挑战。为此，印度理工学院斯里城分校的Shiv Ram Dubey与Snehasis Mukherjee于2018年在ICARCV会议上提出了IIITS MFace数据集。该数据集旨在模拟真实世界场景，涵盖姿态变化、遮挡、面具、眼镜、表情及光照变化等多重复杂因素，填补了现有数据集缺乏多脸图像与复杂背景的空白。其发布为评估手工设计及深度学习人脸描述符的鲁棒性提供了新基准，推动了非约束环境下人脸识别研究的发展。

当前挑战

该数据集所解决的领域问题核心在于非约束环境下的多脸识别，其挑战包括：姿态与视角的剧烈变化、部分或完全遮挡、光照不均、面具与眼镜的干扰，以及多种挑战同时出现的复合场景。构建过程中亦面临多重困难：需在非均匀背景下捕捉包含多人的活动图像，确保每位受试者采集足够数量的样本以覆盖各类变化，同时手工标注所有可见人脸并记录坐标，以验证检测算法。此外，数据集分为Gallery与Probe两组，后者引入了受试者眼镜佩戴状态的混合，进一步增加了识别难度。实验表明，即便是性能优异的VGGFace描述符，在该数据集上的最佳识别率仅为69.39%，凸显了其高度挑战性。

常用场景

经典使用场景

在计算机视觉领域，非约束环境下的多人脸识别始终是一项极具挑战性的任务。IIITS MFace Dataset 专为应对这一难题而设计，其经典使用场景在于评估和验证人脸识别算法在复杂多变条件下的鲁棒性。该数据集包含大量同时呈现姿态变化、部分遮挡、面具遮挡、眼镜佩戴、表情差异以及光照不均等多重挑战的图像，且每张图像中均存在多张人脸。研究者常以此数据集作为基准，测试传统手工设计特征（如局部二值模式及其变体）与深度学习描述符（如VGGFace）在真实非约束场景中的识别性能，从而衡量算法在应对多源干扰时的泛化能力。

实际应用

在实际应用中，IIITS MFace Dataset 为安防监控、智能门禁、人机交互等系统提供了关键测试资源。由于这些系统常需在非受控环境中同时识别多个目标，数据集中的多姿态、部分遮挡及光照变化等挑战直接模拟了真实部署场景（如商场、车站、街道）。其应用价值体现在：一方面，帮助开发者筛选出对遮挡和光照不敏感的识别模型，提升系统在复杂环境下的准确率；另一方面，通过引入面具和眼镜等具体干扰，支持了疫情期间口罩人脸识别、眼镜反光补偿等专项技术的研发。此外，数据集的多手机拍摄特性也使其更贴近移动端应用的实际输入质量。

衍生相关工作

围绕IIITS MFace Dataset的挑战特性，衍生了一系列经典工作。在特征层面，研究者基于该数据集比较了LBP、LTP、LDGP、LGHP等局部描述符，并验证了VGGFace深度特征的局限性，后续工作进而探索了更鲁棒的混合描述符或注意力机制。在度量学习方面，实验表明卡方距离优于欧氏距离，催生了针对该数据集的自适应距离度量优化研究。此外，该数据集也启发了面向非约束环境的轻量级网络设计（如MobileFaceNet的变体），以及基于生成对抗网络的数据增强方法，旨在通过合成多挑战样本提升模型泛化能力。这些衍生研究共同推动了非约束多人脸识别领域的理论突破与工程实践。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集