FR-GESTURE

Name: FR-GESTURE
Creator: 雅典哈罗科皮奥大学·信息与远程通信系; 金斯顿大学·网络与数字媒体系; 西马其顿大学·电气与计算机工程系; 雅典娜研究中心·阿基米德
Published: 2026-02-20 01:31:08
License: 暂无描述

arXiv2026-02-20 更新2026-02-21 收录

下载链接：

https://doi.org/10.5281/zenodo.18131333

下载链接

链接失效反馈

官方服务：

资源简介：

FR-GESTURE是由希腊多所高校联合创建的面向应急救援人机交互的RGBD手势数据集，包含12种专为地面无人车（UGV）设计的战术手势命令。数据集包含3312组同步采集的RGB-深度图像对，覆盖7种距离（1-7米）和3种环境场景（2室内+1室外），通过双Intel RealSense D415摄像头多视角采集以增强多样性。数据采集过程结合了消防员实战手势反馈进行优化，旨在解决复杂灾害场景下非接触式机器人控制的关键需求，为视觉手势识别算法在应急救援领域的应用提供基准资源。

FR-GESTURE is an RGBD gesture dataset tailored for human-robot interaction in emergency rescue operations, jointly developed by multiple universities across Greece. Comprising 12 tactical gesture commands specifically designed for Unmanned Ground Vehicles (UGVs), the dataset contains 3312 synchronized RGB-depth image pairs, covering 7 distance ranges (1–7 meters) and 3 environmental settings (2 indoor, 1 outdoor). To enhance data diversity, all samples were collected from multiple perspectives using dual Intel RealSense D415 cameras. The data collection workflow was optimized based on feedback from firefighters' actual operational gestures, targeting the critical demand for contactless robot control in complex disaster scenarios. This dataset serves as a benchmark resource to facilitate the application of visual gesture recognition algorithms in the emergency rescue domain.

提供机构：

雅典哈罗科皮奥大学·信息与远程通信系; 金斯顿大学·网络与数字媒体系; 西马其顿大学·电气与计算机工程系; 雅典娜研究中心·阿基米德

创建时间：

2026-02-20

搜集汇总

数据集介绍

构建方式

在应急响应领域，人机交互的直观性至关重要，FR-GESTURE数据集的构建过程体现了对这一需求的深入考量。该数据集通过精心设计的采集协议，由七名参与者在三种不同场景中执行十二种定制手势，这些手势灵感来源于现役应急人员的实际信号并经过专家反馈迭代优化。数据采集采用两台Intel RealSense D415摄像头从不同高度和视角同步捕获RGB-D图像对，覆盖了从1米到7米的六个距离梯度，以增强模型对识别范围变化的鲁棒性。采集过程通过自动化脚本引导，确保了3312个样本在格式和标注上的一致性，并经过人工审核以剔除无效数据。

特点

FR-GESTURE数据集的核心特点在于其面向应急响应场景的专用性与多模态数据的丰富性。数据集包含的十二种手势均映射为无人地面车辆的具体指令，如“前来支援”、“获取工具”等，紧密贴合现场作业的实际需求。其样本在室内外多种环境中采集，涵盖了部分遮挡和运动模糊等边缘情况，提升了数据集的现实代表性。同时，RGB与深度信息的同步提供为多模态识别算法开发奠定了基础。数据集的公开性以及均衡的类别分布，进一步支持了手势识别模型在泛化能力与公平性方面的研究。

使用方法

该数据集主要服务于静态视觉手势识别研究，尤其侧重于应急响应中的人机交互应用。研究者可依据论文定义的两类评估协议——均匀划分协议和主体独立协议，对模型性能进行系统评测。均匀协议将数据随机划分为训练、验证和测试集，用于评估模型在已知参与者上的识别能力；主体独立协议则确保各数据分割包含不同的参与者，用以检验模型对未见执行者的泛化性能。数据集提供的RGB-D图像对可直接用于训练基于卷积神经网络或Transformer的图像分类器，也可作为多模态融合算法的输入，以推动鲁棒、远距离手势控制系统的开发。

背景与挑战

背景概述

FR-GESTURE数据集于2026年由雅典哈罗科皮奥大学、金斯顿大学及西马其顿大学的研究团队联合创建，旨在应对应急救援领域中人机交互的迫切需求。该数据集聚焦于通过视觉手势识别技术实现第一响应人员对无人地面车辆的直观控制，其核心研究问题在于构建一个专为灾害救援场景定制、包含多距离多视角RGBD数据的手势指令库。FR-GESTURE的推出填补了现有手势交互数据在应急救援领域的空白，为开发鲁棒性强、环境适应性高的手势控制算法提供了关键实验基础，有力推动了智能机器人在高危作业中的实用化进程。

当前挑战

FR-GESTURE数据集致力于解决应急救援场景下基于视觉的手势识别难题，其核心挑战在于如何在复杂多变的灾害环境中实现远距离、高精度的手势指令理解。具体而言，数据采集过程面临诸多困难：手势需在1至7米的不同距离、室内外多种光照与背景环境下录制，以模拟真实救援现场的条件变异；同时，数据需涵盖12类救援专用手势，并平衡不同执行者间的个体差异。此外，构建具有足够泛化能力的数据集还需克服样本规模有限、参与者多样性不足（如性别与种族分布不均）以及救援装备（如手套、头盔）可能带来的视觉遮挡等问题，这些因素共同增加了模型在实际部署中保持稳定性能的难度。

常用场景

经典使用场景

在应急救援机器人交互领域，FR-GESTURE数据集为视觉手势识别研究提供了关键支持。该数据集通过采集12种定制化手势命令，模拟了第一响应人员在复杂环境下的非接触式人机交互场景。研究者在训练静态手势分类模型时，常利用其多视角、多距离的RGB-D数据，以提升模型在远距离识别和不同光照条件下的鲁棒性。数据集包含室内外三种场景的样本，使得算法能够学习到更具泛化能力的特征表示，为后续的机器人自主导航与指令执行奠定基础。

衍生相关工作

围绕FR-GESTURE数据集，研究者已开展了一系列经典工作。在方法层面，基于ResNet、EfficientNet等图像分类架构的基线实验为后续研究提供了性能参照，并揭示了小样本条件下模型泛化的挑战。数据集的公开促进了多模态融合算法的探索，例如结合RGB与深度信息以提升遮挡情况下的识别率。受其启发，后续研究开始关注穿戴防护装备下的手势识别、跨域适应等延伸问题。该数据集也与HaGRID等大规模手势数据集形成互补，推动了领域自适应与迁移学习在应急救援机器人交互中的具体应用，为构建更安全可靠的人机协作系统提供了数据与算法基础。

数据集最近研究