eye-tracking dataset

Name: eye-tracking dataset
Creator: 南乌拉尔国立大学
Published: 2021-06-02 07:54:23
License: 暂无描述

arXiv2021-06-02 更新2024-07-25 收录

下载链接：

https://www.kaggle.com/datasets/ildaron/dataset-eyetracking

下载链接

链接失效反馈

官方服务：

资源简介：

本数据集名为eye-tracking dataset，由南乌拉尔国立大学创建，旨在为眼动追踪任务提供训练数据。数据集包含10,000张经过标注的眼睛图像，分辨率为416x416像素，每张图像均标注了眼睛的中心坐标和半径。创建过程中，使用了dlib库进行眼睛区域的提取和标注，并通过OpenCV库将图像分辨率调整至所需大小。该数据集主要用于开发和训练卷积神经网络，以解决眼动追踪技术中的高成本和低精度问题，特别是在多媒体学习和实时图形系统中的应用。

This dataset, named eye-tracking dataset, was developed by South Ural State University to provide training data for eye-tracking tasks. The dataset contains 10,000 annotated eye images with a resolution of 416×416 pixels, and each image is annotated with the central coordinates and radius of the eye. During its development, the dlib library was utilized for eye region extraction and annotation, while the OpenCV library was employed to resize the images to the required resolution. This dataset is primarily used for developing and training convolutional neural networks (CNNs) to address the issues of high cost and low precision in eye-tracking technology, particularly for applications in multimedia learning and real-time graphics systems.

提供机构：

南乌拉尔国立大学

创建时间：

2021-06-02

搜集汇总

数据集介绍

构建方式

该眼动追踪数据集的构建过程始于从Kaggle平台获取的高分辨率人脸图像集合，这些图像最初分辨率为1280×720像素。利用dlib库中的回归树集成算法，首先检测并定位人脸轮廓，随后通过dlib.shape_predictor命令精确识别面部特征点，特别是眼睛区域。通过扩展这些特征点，使用OpenCV库将眼睛区域放大至416×416像素，确保图像细节的充分保留。接着，通过实验确定的阈值函数THRESH_BINARY，程序自动识别并标注瞳孔位置及其半径，最终形成包含10,000张标注图像的数据集。

特点

此眼动追踪数据集的显著特点在于其高分辨率图像（416×416像素）和精确的瞳孔位置标注。每张图像不仅包含瞳孔的中心坐标，还详细记录了其半径，这为卷积神经网络的训练提供了丰富的特征信息。此外，数据集的设计特别关注于瞳孔与眼白区域的边界识别，这对于提高眼动追踪系统的准确性至关重要。

使用方法

该数据集主要用于预训练卷积神经网络模型，以实现高效的眼动追踪任务。用户可以通过访问GitHub上的Python程序代码，自行下载并处理数据集。在模型训练过程中，建议先使用此数据集进行初步训练，随后结合个人数据进行微调，以提高模型对特定用户瞳孔特征的识别能力。数据集的详细标注信息和图像处理流程为开发者提供了清晰的指导，有助于快速上手并优化眼动追踪系统的性能。

背景与挑战

背景概述

近年来，随着深度神经网络的发展，眼动追踪技术在多媒体学习、网页浏览和实时图形系统中得到了广泛应用，尤其在视频游戏中备受青睐。然而，现代眼动追踪系统的高成本问题依然存在，设备精度为0.5°的价格高达数千美元。为解决这一问题，Rakhmatulin Ildar博士及其团队在南乌拉尔州立大学开发了一个专门用于眼动追踪任务的数据集。该数据集包含10,000张416x416像素的注释眼图像，旨在训练卷积神经网络模型以识别瞳孔位置。这一数据集的创建不仅填补了眼动追踪领域数据集的空白，还为开发低成本、高精度的眼动追踪设备提供了可能。

当前挑战

眼动追踪数据集的构建面临多重挑战。首先，眼动追踪任务需要高度精确的瞳孔识别，而不同个体的眼睛颜色和特征差异巨大，这要求神经网络能够捕捉与颜色无关的特征。其次，数据集的构建过程中，研究人员需克服图像分辨率的选择问题，确保在416x416像素的分辨率下仍能有效识别瞳孔。此外，数据集的标注工作复杂且耗时，需精确记录每张图像中瞳孔的中心坐标和半径。最后，尽管该数据集已包含10,000张图像，但在实际应用中，仍需进一步扩展和多样化，以应对不同光照条件和头部姿态下的眼动追踪需求。

常用场景

经典使用场景

在眼动追踪领域，eye-tracking dataset 数据集的经典使用场景主要集中在卷积神经网络（CNN）模型的训练上。该数据集包含了10,000张标注有瞳孔位置和半径的眼睛图像，分辨率为416x416像素。这些图像被用于训练自定义的CNN模型，以实现对瞳孔位置的精确检测和跟踪。通过使用该数据集，研究者和开发者能够独立预训练卷积神经网络模型，从而提高眼动追踪系统的准确性和效率。

衍生相关工作

基于 eye-tracking dataset 数据集，研究者们开展了一系列相关工作。例如，有研究利用该数据集开发了轻量级的头部姿态不变视线追踪系统，通过减少计算资源的需求，提高了系统的实时性和便携性。此外，还有研究探索了在不同光照条件下视线追踪的鲁棒性，通过数据增强和模型优化，提升了系统在复杂环境中的表现。这些衍生工作不仅扩展了眼动追踪技术的应用范围，还推动了相关领域的技术进步。

数据集最近研究