MPIIGaze

github2023-12-21 更新2024-05-31 收录

下载链接：

https://github.com/Kevin-Kwan/modified_training_pytorch_mpiigaze

下载链接

链接失效反馈

官方服务：

资源简介：

一个用于深度学习项目中的修改训练库，专注于MPIIGaze数据集。

A modified training library for deep learning projects, focused on the MPIIGaze dataset.

创建时间：

2023-11-29

原始信息汇总

数据集概述

数据集名称

MPIIGaze
MPIIFaceGaze

数据集下载与预处理

MPIIGaze:
- 下载命令: bash scripts/download_mpiigaze_dataset.sh
- 预处理命令: python tools/preprocess_mpiigaze.py --dataset datasets/MPIIGaze -o datasets/
MPIIFaceGaze:
- 下载命令: bash scripts/download_mpiifacegaze_dataset.sh
- 预处理命令: python tools/preprocess_mpiifacegaze.py --dataset datasets/MPIIFaceGaze_normalized -o datasets/

使用方法

配置管理使用YACS。
默认参数配置文件: gaze_estimation/config/defaults.py。
可通过YAML文件覆盖默认参数，例如: configs/mpiigaze/lenet_train.yaml。

训练与评估

训练命令: python train.py --config configs/mpiigaze/lenet_train.yaml
评估命令: python evaluate.py --config configs/mpiigaze/lenet_eval.yaml
使用脚本可进行所有训练和评估:
- scripts/run_all_mpiigaze_lenet.sh
- scripts/run_all_mpiigaze_resnet_preact.sh

结果

MPIIGaze:

模型平均测试角度误差 [度] 训练时间

LeNet 6.52 3.5 s/epoch

ResNet-preact-8 5.73 7 s/epoch
MPIIFaceGaze:

模型平均测试角度误差 [度] 训练时间

AlexNet 5.06 135 s/epoch

ResNet-14 4.83 62 s/epoch

演示

演示程序用于通过网络摄像头视频进行注视估计。
需要下载dlib预训练模型并进行摄像头校准。
运行命令: python demo.py --config configs/demo_mpiigaze_resnet.yaml

参考文献

Zhang, Xucong, et al. "Appearance-based Gaze Estimation in the Wild." CVPR, 2015.
Zhang, Xucong, et al. "Its Written All Over Your Face: Full-Face Appearance-Based Gaze Estimation." CVPRW, 2017.
Zhang, Xucong, et al. "MPIIGaze: Real-World Dataset and Deep Appearance-Based Gaze Estimation." IEEE TPAMI, 2017.
Zhang, Xucong, et al. "Evaluation of Appearance-Based Methods and Implications for Gaze-Based Applications." CHI, 2019.

搜集汇总

数据集介绍

构建方式

MPIIGaze数据集的构建基于真实世界场景中的眼动追踪数据，通过高分辨率摄像头捕捉参与者的面部图像和视线方向。数据采集过程中，参与者被要求在自然环境下进行日常活动，以确保数据的多样性和真实性。数据集经过预处理，包括图像归一化和标注，以确保其适用于深度学习模型的训练和评估。

特点

MPIIGaze数据集的特点在于其丰富的样本量和高质量的真实世界数据。数据集包含大量不同光照条件和头部姿态下的面部图像，能够有效支持基于外观的视线估计任务。此外，数据集还提供了详细的视线方向标注，使得其在视线估计领域具有较高的研究价值和应用潜力。

使用方法

使用MPIIGaze数据集时，首先需要通过提供的脚本下载并预处理数据。随后，用户可以利用YACS配置管理系统对模型进行训练和评估。通过运行训练脚本，用户可以在特定配置下训练模型，并使用评估脚本对模型性能进行测试。此外，数据集还支持实时视线估计的演示程序，用户可以通过摄像头进行实时视线估计实验。

背景与挑战

背景概述

MPIIGaze数据集由马克斯·普朗克信息学研究所的研究团队于2015年首次发布，旨在解决基于外观的视线估计问题。该数据集的核心研究问题是通过分析人眼图像来估计视线方向，进而推动人机交互、虚拟现实和增强现实等领域的发展。MPIIGaze数据集包含了大量真实世界中的眼动数据，涵盖了不同光照条件、头部姿态和面部表情的变化，为研究者提供了一个极具挑战性的基准。该数据集的发布极大地推动了视线估计领域的研究，成为该领域的标准数据集之一。

当前挑战

MPIIGaze数据集在解决视线估计问题时面临多重挑战。首先，视线估计的准确性受到光照变化、头部姿态和面部表情的显著影响，如何在复杂环境下保持高精度的估计是一个关键难题。其次，数据集的构建过程中，研究人员需要克服数据采集的复杂性，确保数据的多样性和代表性。此外，由于视线估计涉及隐私问题，数据集的采集和使用必须严格遵守伦理规范，这也为数据集的构建和共享带来了额外的挑战。这些挑战不仅推动了算法的创新，也促使研究者不断优化数据采集和处理流程。

常用场景

经典使用场景

MPIIGaze数据集在计算机视觉领域中被广泛应用于视线估计任务。该数据集通过捕捉真实世界中的眼部图像，为研究者提供了一个丰富的训练和测试平台。其经典使用场景包括基于外观的视线估计模型的训练与验证，尤其是在非受控环境下的视线方向预测。通过该数据集，研究者能够评估不同模型在复杂光照、头部姿态变化等条件下的性能表现。

实际应用

MPIIGaze数据集的实际应用场景广泛，涵盖了人机交互、虚拟现实、增强现实以及驾驶员监控系统等领域。例如，在虚拟现实设备中，基于MPIIGaze训练的视线估计模型能够实时追踪用户的视线方向，从而优化用户体验。在驾驶员监控系统中，该数据集支持的模型可以检测驾驶员的注意力状态，提升行车安全性。此外，MPIIGaze还为智能广告、医疗辅助等应用提供了技术支持。

衍生相关工作

MPIIGaze数据集衍生了许多经典研究工作，推动了视线估计领域的发展。例如，基于该数据集的研究提出了多种深度学习模型，如LeNet和ResNet的变体，显著提升了视线估计的精度。此外，MPIIGaze还催生了MPIIFaceGaze等扩展数据集，进一步丰富了全脸视线估计的研究内容。相关研究不仅在学术会议上发表了多篇高影响力论文，还开源了多个工具和框架，如PyTorch实现和Demo程序，为后续研究提供了便利。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集

模型	平均测试角度误差 [度]	训练时间
LeNet	6.52	3.5 s/epoch
ResNet-preact-8	5.73	7 s/epoch

模型	平均测试角度误差 [度]	训练时间
AlexNet	5.06	135 s/epoch
ResNet-14	4.83	62 s/epoch

MPIIGaze

数据集概述

数据集名称

数据集下载与预处理

使用方法

训练与评估

结果

演示

相关资源

参考文献