DIRL Gaze Dataset

github2025-04-02 更新2025-04-11 收录

下载链接：

https://github.com/dtoyoda10/eye-contact-cnn

下载链接

链接失效反馈

官方服务：

资源简介：

37名亚洲志愿者参与了我们的数据集收集。大约100个凝视方向在水平方向+40到-40度和垂直方向+30到-30度的范围内收集，其中63张和37张图像分别是固定和随机方向的。闭眼的图像已被移除。

Thirty-seven Asian volunteers participated in the data collection for our dataset. Approximately 100 gaze directions were collected within the ranges of +40° to -40° in the horizontal direction and +30° to -30° in the vertical direction. Of these, 63 and 37 images were captured with fixed and random gaze directions respectively. Images with closed eyes have been removed.

创建时间：

2025-03-26

原始信息汇总

数据集概述

数据集名称

DIRL Gaze Dataset

数据集描述

37名亚洲志愿者参与数据收集。
收集约100个视线方向，范围在水平方向+40至-40度，垂直方向+30至-30度。
包含63张固定方向和37张随机方向的图像。
移除了闭眼的图像。

系统使用

python python regz_socket_MP_FD.py

参数配置

需要在"config.py"中个性化以下参数：
- "P_c_x", "P_c_y", "P_c_z"：摄像头位置与屏幕中心的相对距离（cm）。
- "S_W"和"S_H"：屏幕尺寸（cm）。
- "f"：摄像头的焦距。

焦距校准

执行脚本"focal_length_calibration.ipynb"或"focal_length_calibration.py"来估计焦距（f）。
校准步骤：
1. 将头部放置在摄像头前约50 cm处（可在代码中修改此值）。
2. 在代码中插入瞳距（两眼之间的距离）或使用平均值6.3 cm。

视线校正（自演示）

聚焦"local"窗口并按r键开始视线校正。
聚焦"local"窗口并按q键退出程序。

在线视频通信

本地和远程端的代码相同。
需在两端定义以下参数：
- "tar_ip"：对方的IP地址。
- "sender_port"：发送重定向视线视频的端口号。
- "recver_port"：接收重定向视线视频的端口号。

自演示的IP设置

"tar_ip"：127.0.0.1。
"sender_port"：5005。
"recver_port"：5005。

环境要求

Python 3.5.3。
Tensorflow 1.8.0。
Cuda V9.0.176及相应的cuDnn。

依赖包

Dlib 18.17.100。
OpenCV 3.4.1。
Numpy 1.15.4 + mkl。
pypiwin32。
scipy 0.19.1。

搜集汇总

数据集介绍

构建方式

DIRL Gaze Dataset的构建依托于37名亚洲志愿者的参与，通过精心设计的实验流程采集了约100个不同方向的凝视数据。数据覆盖水平方向±40度和垂直方向±30度的范围，其中包含63个固定方向和37个随机方向的图像样本。在数据预处理阶段，研究人员剔除了闭眼状态的无效图像，确保了数据质量。数据采集过程中采用了标准化设备配置，包括精确标定的摄像头和屏幕参数设置。

特点

该数据集以其精确的凝视方向标注和多样化的样本分布脱颖而出。数据范围全面覆盖了人眼自然运动的典型区域，既包含系统性采集的固定方向样本，也包含随机方向样本以增强数据多样性。所有图像均经过严格筛选，排除了闭眼等无效状态，保证了数据的纯净度。亚洲人种样本的专属性使该数据集在相关领域研究中具有独特的代表性价值。

使用方法

使用该数据集需配置Python 3.5.3环境和指定版本的TensorFlow等依赖库。通过修改config.py文件中的摄像头位置、屏幕尺寸等参数进行个性化设置。系统提供焦距校准工具，用户可运行focal_length_calibration脚本完成摄像头标定。实际应用时，通过快捷键控制凝视校正功能的启停，系统支持本地演示和网络视频通信两种模式，需正确配置IP地址和端口参数。

背景与挑战

背景概述

DIRL Gaze Dataset是由研究团队开发的专注于视线校正的数据集，旨在通过基于形变的卷积神经网络技术提升视线估计的准确性。该数据集由37名亚洲志愿者参与构建，采集了水平方向±40度和垂直方向±30度范围内的约100种视线方向数据，其中包含63个固定方向和37个随机方向的图像。数据集的创建为视线跟踪、人机交互以及远程视频通信等领域的算法优化提供了重要支持。

当前挑战

DIRL Gaze Dataset在构建与应用过程中面临多重挑战。在领域问题层面，视线估计需克服个体生理差异、头部姿态变化以及环境光照干扰等因素的影响，确保模型在复杂场景下的鲁棒性。数据集构建过程中，采集设备的标定精度、志愿者视线方向的多样性以及无效数据（如闭眼图像）的筛选均对数据质量提出了较高要求。此外，跨平台部署时，不同硬件配置与网络延迟问题也为实际应用带来了技术挑战。

常用场景

经典使用场景

DIRL Gaze Dataset在视线追踪领域具有重要应用价值，其经典使用场景包括基于卷积神经网络的视线校正系统开发。该数据集通过采集37名亚洲志愿者在水平±40度和垂直±30度范围内的100种视线方向数据，为研究人员提供了丰富的训练样本。数据集包含固定和随机视线方向的图像，为开发高精度的视线估计模型奠定了数据基础。

实际应用

DIRL Gaze Dataset的实际应用场景广泛，包括视频会议中的视线校正、虚拟现实交互、驾驶员注意力监测等。在远程视频通信中，该系统能实时调整用户视线方向，创造更自然的面对面交流体验。数据集提供的参数配置方案可直接应用于实际系统部署，实现厘米级的视线定位精度。

衍生相关工作

基于DIRL Gaze Dataset已衍生出多项重要研究工作，包括基于扭曲卷积网络的视线校正算法、跨设备视线迁移学习框架等。该数据集为后续视线估计领域的基准测试提供了标准参照，启发了多模态视线融合、低延迟实时处理等创新方向的研究。相关成果已应用于智能人机交互系统的开发。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集