five

eye-tracking dataset|眼动追踪数据集|卷积神经网络数据集

收藏
arXiv2021-06-02 更新2024-07-25 收录
眼动追踪
卷积神经网络
下载链接:
https://www.kaggle.com/datasets/ildaron/dataset-eyetracking
下载链接
链接失效反馈
资源简介:
本数据集名为eye-tracking dataset,由南乌拉尔国立大学创建,旨在为眼动追踪任务提供训练数据。数据集包含10,000张经过标注的眼睛图像,分辨率为416x416像素,每张图像均标注了眼睛的中心坐标和半径。创建过程中,使用了dlib库进行眼睛区域的提取和标注,并通过OpenCV库将图像分辨率调整至所需大小。该数据集主要用于开发和训练卷积神经网络,以解决眼动追踪技术中的高成本和低精度问题,特别是在多媒体学习和实时图形系统中的应用。
提供机构:
南乌拉尔国立大学
创建时间:
2021-06-02
AI搜集汇总
数据集介绍
main_image_url
构建方式
该眼动追踪数据集的构建过程始于从Kaggle平台获取的高分辨率人脸图像集合,这些图像最初分辨率为1280×720像素。利用dlib库中的回归树集成算法,首先检测并定位人脸轮廓,随后通过dlib.shape_predictor命令精确识别面部特征点,特别是眼睛区域。通过扩展这些特征点,使用OpenCV库将眼睛区域放大至416×416像素,确保图像细节的充分保留。接着,通过实验确定的阈值函数THRESH_BINARY,程序自动识别并标注瞳孔位置及其半径,最终形成包含10,000张标注图像的数据集。
特点
此眼动追踪数据集的显著特点在于其高分辨率图像(416×416像素)和精确的瞳孔位置标注。每张图像不仅包含瞳孔的中心坐标,还详细记录了其半径,这为卷积神经网络的训练提供了丰富的特征信息。此外,数据集的设计特别关注于瞳孔与眼白区域的边界识别,这对于提高眼动追踪系统的准确性至关重要。
使用方法
该数据集主要用于预训练卷积神经网络模型,以实现高效的眼动追踪任务。用户可以通过访问GitHub上的Python程序代码,自行下载并处理数据集。在模型训练过程中,建议先使用此数据集进行初步训练,随后结合个人数据进行微调,以提高模型对特定用户瞳孔特征的识别能力。数据集的详细标注信息和图像处理流程为开发者提供了清晰的指导,有助于快速上手并优化眼动追踪系统的性能。
背景与挑战
背景概述
近年来,随着深度神经网络的发展,眼动追踪技术在多媒体学习、网页浏览和实时图形系统中得到了广泛应用,尤其在视频游戏中备受青睐。然而,现代眼动追踪系统的高成本问题依然存在,设备精度为0.5°的价格高达数千美元。为解决这一问题,Rakhmatulin Ildar博士及其团队在南乌拉尔州立大学开发了一个专门用于眼动追踪任务的数据集。该数据集包含10,000张416x416像素的注释眼图像,旨在训练卷积神经网络模型以识别瞳孔位置。这一数据集的创建不仅填补了眼动追踪领域数据集的空白,还为开发低成本、高精度的眼动追踪设备提供了可能。
当前挑战
眼动追踪数据集的构建面临多重挑战。首先,眼动追踪任务需要高度精确的瞳孔识别,而不同个体的眼睛颜色和特征差异巨大,这要求神经网络能够捕捉与颜色无关的特征。其次,数据集的构建过程中,研究人员需克服图像分辨率的选择问题,确保在416x416像素的分辨率下仍能有效识别瞳孔。此外,数据集的标注工作复杂且耗时,需精确记录每张图像中瞳孔的中心坐标和半径。最后,尽管该数据集已包含10,000张图像,但在实际应用中,仍需进一步扩展和多样化,以应对不同光照条件和头部姿态下的眼动追踪需求。
常用场景
经典使用场景
在眼动追踪领域,eye-tracking dataset 数据集的经典使用场景主要集中在卷积神经网络(CNN)模型的训练上。该数据集包含了10,000张标注有瞳孔位置和半径的眼睛图像,分辨率为416x416像素。这些图像被用于训练自定义的CNN模型,以实现对瞳孔位置的精确检测和跟踪。通过使用该数据集,研究者和开发者能够独立预训练卷积神经网络模型,从而提高眼动追踪系统的准确性和效率。
衍生相关工作
基于 eye-tracking dataset 数据集,研究者们开展了一系列相关工作。例如,有研究利用该数据集开发了轻量级的头部姿态不变视线追踪系统,通过减少计算资源的需求,提高了系统的实时性和便携性。此外,还有研究探索了在不同光照条件下视线追踪的鲁棒性,通过数据增强和模型优化,提升了系统在复杂环境中的表现。这些衍生工作不仅扩展了眼动追踪技术的应用范围,还推动了相关领域的技术进步。
数据集最近研究
最新研究方向
近年来,眼动追踪技术在多媒体学习、网页浏览和实时图形系统中的应用日益广泛,尤其是在视频游戏领域。然而,现代眼动追踪系统的高成本问题依然存在,设备精度为0.5°的价格高达数千美元。为了解决这一问题,研究人员开始探索使用卷积神经网络(CNN)进行眼动追踪任务,特别是针对虹膜识别的高精度需求。Rakhmatulin Ildar等人提出的眼动追踪数据集,包含10,000张416x416像素的标注眼图像,旨在为自定义卷积神经网络模型的训练提供数据支持。该数据集不仅有助于开发用于检测、分割和分类虹膜位置的神经网络,还为个性化虹膜识别提供了基础。通过使用该数据集,研究人员可以独立预训练卷积神经网络模型,从而降低眼动追踪系统的成本并提高其精度。这一研究方向在眼动追踪领域具有重要意义,有望推动该技术在更多应用场景中的普及和优化。
相关研究论文
  • 1
    Dataset for eye-tracking tasks南乌拉尔国立大学 · 2021年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

网易云音乐数据集

该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。

github 收录

URPC系列数据集, S-URPC2019, UDD

URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。

github 收录

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

UAVDT

UAVDT是一个用于目标检测任务的数据集。

github 收录

VisDrone2019

VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。

github 收录