Gaze4HRI
收藏数据集概述:Gaze4HRI
Gaze4HRI 是一个面向人机交互场景的大规模视线估计数据集,其相关论文已被 FG 2026(第20届IEEE国际自动人脸与姿态识别会议)接收。该数据集旨在为评估视线估计神经网络在零样本(Zero-shot)人机交互环境下的表现提供基准。
1. 数据集内容与结构
-
实验设置:数据集包含四种主要实验设置,并细分为十种实验类型:
- 光照设置:
lighting_10,lighting_25,lighting_50,lighting_100(不同光照级别)。 - 摄像头视角设置:
circular_movement(圆形运动)。 - 头部与视线冲突设置:
head_pose_left,head_pose_middle,head_pose_right(不同头部姿态)。 - 运动目标(相互注视)设置:
line_movement_slow,line_movement_fast(慢速/快速直线运动)。
- 光照设置:
-
原始文件结构:数据以嵌套目录结构组织,格式为:
YYYY-MM-DD/SubjectName/exp_type/point/。其中,如果存在重录情况,每个point目录下会包含以时间戳命名的子目录,评估时会使用最新的时间戳子目录。
2. 技术框架与依赖
- 主仓库:该GitHub仓库是Gaze4HRI项目的主代码库,包含数据采集、数据集创建(HDF5格式)、视线/眨眼估计以及论文结果分析的相关脚本。
- 模型仓库:用于运行各视线估计模型的代码位于另一个独立的仓库
GazeModels(https://github.com/GazeForHRI/GazeModels/tree/main),每个模型对应一个分支。
3. 核心脚本与功能
代码库中的脚本按功能分为以下几类:
-
核心数据管理与工具:
config.py:包含所有通用的辅助函数,用于数据采集和分析。data_loader.py:用于加载录制视频、头部姿态和视线真值数据的加载器。data_matcher.py:负责100Hz运动捕捉数据与30Hz图像数据的传感器融合与同步。flatten_dir.py:用于在原始数据嵌套结构之间进行数据导入/导出的关键脚本。
-
Gaze4HRI Torch数据集:
- 提供用于训练视线估计模型的PyTorch数据集类和相关脚本,输入为矫正后的图像。
h5_dataset_creator.py:创建HDF5格式的数据集。data_rectification.py和unrectification.py:执行数据的矫正和逆矫正,以适配不同模型的需求。
-
Blink4HRI Torch数据集(眨眼检测):
- 提供用于训练眨眼检测模型(基于BlinkLinMulT)的相关脚本。
h5_blink4hri_creator.py等:创建和拆分眨眼检测数据集。exordium_landmarks.py:用于生成面部/眼部裁剪区域和眼部长宽比(EAR)特征。
-
推断与评估:
- 视线估计:
gaze_estimation.py提供了用于测试任何视线模型的抽象类;gaze_estimation_batch.py则是批量运行推断的脚本。 - 眨眼估计:
blink_annotation.py用于手动标注眨眼帧;blmt_train.py/blmt_test.py用于在Blink4HRI数据集上训练和测试BlinkLinMulT模型。
- 视线估计:
-
分析与论文实验:
data_analyzer_batch.py和structured_results.py:批量计算视线误差并聚合结果,生成gaze_evaluation_results.csv。analyze_by_group.py:按模型、实验类型、目标点、性别等维度分析视线误差。- 其他脚本:用于生成论文中具体实验的结果,如光照分析、摄像头视角分析、头部-视线冲突分析等。
-
数据采集与标定:
data_collector.py:录制数据的主要脚本。head_eye_calibration.py和table_target_calibration.py:分别用于头部-眼睛标定和桌子到注视目标点的静态变换标定。
4. 引用信息
如果您在研究中使用了该数据集,请引用其论文:
bibtex @inproceedings{sezer2026gaze4hri, title={Gaze4HRI: Zero-shot Benchmarking Gaze Estimation Neural-Networks for Human-Robot Interaction}, author={Sezer, Berk and Küçük, Ali Görkem and Şahin, Erol and Kalkan, Sinan}, booktitle={2026 International Conference on Automatic Face and Gesture Recognition (FG)}, year={2026}, doi={10.5281/zenodo.19710372} }
- 论文可在 arXiv 上获取:https://arxiv.org/abs/2605.04770




