Numeral Gesture Dataset
收藏arXiv2017-09-20 更新2024-06-21 收录
下载链接:
https://github.com/PhilipCorr/numeral-gesture-dataset
下载链接
链接失效反馈官方服务:
资源简介:
Numeral Gesture Dataset是由都柏林大学学院计算机科学学院创建的一个大型数据集,专门用于智能手机触摸屏上的数字手势识别。该数据集包含260名用户输入的20,217个阿拉伯数字的数据,记录了每个数字的空间和时间触摸信息。数据集的创建过程包括用户在触摸屏上随机输入数字0到9四次,使用手指或拇指进行操作,并通过软件应用记录数据。该数据集的应用领域主要集中在提高触摸屏设备的数字输入识别准确性和速度,特别是在小型设备如智能手表上的应用,旨在解决屏幕空间有限的问题。
Numeral Gesture Dataset is a large-scale dataset developed by the School of Computer Science, University College Dublin, exclusively for numeric gesture recognition on smartphone touchscreens. It encompasses 20,217 samples of Arabic numerals input by 260 users, recording both the spatial and temporal touch data for each digit. The dataset was constructed by having users perform random input of digits 0 through 9 four times via finger or thumb on a touchscreen, with data captured through a dedicated software application. The primary application scenarios of this dataset focus on enhancing the accuracy and speed of numeric input recognition on touchscreen devices, particularly for compact devices such as smartwatches, with the goal of addressing the limitation of limited screen space.
提供机构:
都柏林大学学院计算机科学学院
创建时间:
2017-09-20
搜集汇总
数据集介绍

构建方式
在触屏手势识别领域,数据集的构建需兼顾真实性与多样性。Numeral Gesture Dataset的构建通过专门开发的应用程序在4.7英寸iPhone 6上完成,招募了260名参与者,涵盖不同性别、用手习惯、国籍和年龄范围。每位参与者使用食指和拇指分别输入数字0至9各四次,输入顺序随机,并通过语音合成提供指导以避免手势形态的暗示。触摸数据以60Hz的采样频率记录,包含空间坐标和时间戳,最终收集了20,217个数字手势样本,并经过人工审核标记无效数据,确保了数据质量与代表性。
特点
该数据集的核心特点在于其专注于在线触屏手势识别,尤其针对手指和拇指输入的数字手势,弥补了传统笔迹数据集的不足。数据集不仅提供了丰富的时空触摸信息,包括连续触摸点的坐标序列和时间戳,还涵盖了多模态输入场景,如单手拇指操作。其样本规模较大,且具有显著的人口统计学多样性,增强了模型的泛化能力。与离线图像数据集不同,该数据集支持早期识别研究,为实时交互应用提供了宝贵资源。
使用方法
数据集适用于训练和评估在线数字手势识别模型,尤其适合深度学习方法的探索。研究人员可将数据分割为训练集、验证集和测试集,例如采用60%-20%-20%的比例。模型输入可处理为两种形式:一是通过插值生成位图图像,应用二维卷积神经网络进行识别;二是将触摸点序列转换为极坐标向量,利用一维卷积神经网络处理时空特征。数据集中包含多笔画手势,但实验表明仅使用最长笔画能提升准确率。该开源数据集可直接从GitHub仓库获取,便于社区复现和扩展研究。
背景与挑战
背景概述
随着智能手机与平板电脑的普及,触摸屏已成为人机交互的核心界面。虚拟键盘虽广泛用于文本输入,却占据大量屏幕空间,这在智能手表等小型设备上尤为突出。手指或拇指书写手势因其可在屏幕图像或背景上直接执行,为小屏幕设备提供了替代输入方案。然而,以往手写识别研究多集中于笔纸书写的离线字符识别,如MNIST数据集,而针对触摸屏在线手势识别的研究尚显匮乏。为此,都柏林大学学院的研究团队于2017年创建了Numeral Gesture Dataset,旨在填补在线手指数字手势识别领域的空白。该数据集采集了260名用户通过手指与拇指在智能手机触摸屏上输入的阿拉伯数字,包含空间与时间触摸数据,共计20,217个数字样本。其核心研究问题是探索如何在资源受限的移动设备上实现高效、准确的在线数字手势识别,推动小屏幕设备自然交互技术的发展。
当前挑战
Numeral Gesture Dataset所针对的在线数字手势识别领域面临多重挑战。在领域问题层面,手指或拇指书写相较于笔触具有更高的变异性,手势形状往往不够规整,增加了模型区分相似数字(如'1'与'7')的难度;同时,在线识别需处理连续触摸点的时空序列,要求模型能够实时解析动态手势,并支持早期识别以加速输入流程。在数据集构建过程中,挑战主要体现于数据采集的规范性与一致性。触摸屏的采样频率与空间精度未知,且不同用户的手势习惯、书写速度与力度差异显著,导致数据噪声较大;此外,多笔画手势(如数字'4'或'5')的连贯性处理较为复杂,需设计有效的数据表示方法以保留时序信息。这些挑战共同制约着在线手势识别系统在精度与效率上的平衡。
常用场景
经典使用场景
在触屏交互领域,Numeral Gesture Dataset为在线手势数字识别研究提供了关键数据支撑。该数据集通过记录用户在智能手机触摸屏上使用手指或拇指绘制的阿拉伯数字轨迹,包含空间与时间维度的触摸数据,为深度学习模型的训练与评估奠定了坚实基础。其经典应用场景在于探索触屏手写数字识别的算法性能,特别是在资源受限的移动设备上实现高效识别,为虚拟键盘占用屏幕空间的问题提供了替代输入方案。
解决学术问题
该数据集有效解决了触屏手写数字识别中的若干学术难题。传统在线字符识别研究多集中于笔式输入,而手指或拇指绘制的手势存在更大变异性与字形不规范性,数据集通过大规模真实用户样本捕捉了这些特征。研究通过对比二维位图输入与一维极坐标向量输入的卷积神经网络模型,揭示了时序信息对提升识别精度的作用,同时验证了轻量化模型在保持较高准确率方面的可行性,为移动计算环境下的实时识别提供了理论依据。
衍生相关工作
该数据集的发布催生了多项相关经典研究工作。在模型架构方面,研究者受其启发进一步优化了时序特征提取网络,发展了适用于在线手势识别的轻量级卷积神经网络变体。同时,数据集促进了早期数字识别技术的探索,即在字形未完全绘制时进行实时预测,以加速输入流程。此外,该资源也被广泛应用于跨设备手势适应性研究、用户行为分析以及触屏交互的个性化建模,为人类计算机交互领域注入了新的研究活力。
以上内容由遇见数据集搜集并总结生成



