emg2qwerty
收藏arXiv2024-10-26 更新2024-10-30 收录
下载链接:
https://github.com/facebookresearch/emg2qwerty
下载链接
链接失效反馈官方服务:
资源简介:
emg2qwerty数据集是由Meta公司创建的一个大规模非侵入性肌电图信号数据集,专门用于触摸打字任务。该数据集包含108名用户在打字时手腕处记录的1,135个会话,总计346小时的数据,是目前最大的公开sEMG数据集。数据集的创建过程包括精确的地面实况注释和可重复的基线模型。该数据集的应用领域主要集中在提高人机交互的带宽,特别是在增强现实和虚拟现实环境中,旨在解决现有输入方式(如键盘、鼠标和触摸屏)带宽受限的问题。
The emg2qwerty dataset is a large-scale non-invasive electromyography (EMG) dataset created by Meta, specifically designed for touch typing tasks. It contains 1,135 sessions of wrist EMG signals recorded from 108 users during typing, totaling 346 hours of data, making it the largest publicly available sEMG dataset to date. The dataset creation process includes precise ground truth annotations and reproducible baseline models. Its application areas mainly focus on improving the bandwidth of human-computer interaction, especially in augmented reality (AR) and virtual reality (VR) environments, aiming to address the bandwidth limitation issues of existing input methods such as keyboards, mice and touchscreens.
提供机构:
Meta
创建时间:
2024-10-26
搜集汇总
数据集介绍

构建方式
emg2qwerty数据集通过记录108名参与者在手腕佩戴表面肌电图(sEMG)传感器的同时进行QWERTY键盘触摸打字的活动构建而成。该数据集包含1,135个会话,总计346小时的记录,是目前最大的公开sEMG数据集。数据收集过程中,参与者被要求在Apple Magic键盘上输入随机抽取的单词和句子,这些文本经过处理以去除敏感内容并仅保留小写字母和基本标点符号。每个会话的数据包括左右手腕的sEMG信号、提示文本、由键盘记录器记录的按键时间和按键释放时间,以及相关的元数据。数据经过基本的质量检查和预处理,如高通过滤和时间戳对齐,以确保数据的一致性和可用性。
特点
emg2qwerty数据集的主要特点在于其规模和多样性。该数据集不仅在数据量上远超现有同类数据集,还在参与者和会话的数量上具有显著优势。此外,数据集专注于自然打字行为,而非静态手势,这使得其更贴近实际应用场景。数据集还包含了详细的按键时间戳和按键释放时间,这对于精确建模和评估模型性能至关重要。由于sEMG信号的生成过程与语音信号不同,该数据集为研究非语音连续信号的建模提供了独特的视角。
使用方法
emg2qwerty数据集适用于研究sEMG信号与键盘输入之间的映射关系,特别是在自动语音识别(ASR)领域的相关技术可以被借鉴和应用于此任务。研究者可以使用该数据集训练和验证模型,以预测按键序列。数据集的基准模型采用了ASR中的标准组件和方法,如时间深度分离卷积网络(TDS)和连接主义时序分类(CTC)损失函数。此外,数据集提供了详细的训练、验证和测试分割,以及用于生成这些分割的脚本,便于研究者在不同用户和会话间进行泛化能力的评估。
背景与挑战
背景概述
emg2qwerty数据集由Meta旗下的Reality Labs推出,旨在解决非侵入性表面肌电图(sEMG)信号在触摸打字任务中的应用问题。该数据集于2024年创建,包含108名用户在触摸QWERTY键盘时记录的1,135个会话,总计346小时的数据。其核心研究问题在于利用sEMG信号预测键盘按键,这对于提高人机交互带宽具有重要意义。该数据集不仅规模庞大,而且提供了精确的地面实况注释和可重复的基准,对机器学习和神经科学领域具有深远影响。
当前挑战
emg2qwerty数据集面临的挑战主要集中在两个方面。首先,数据集解决了图像分类领域的问题,即如何从sEMG信号中准确预测键盘按键。这一任务的复杂性在于sEMG信号的生成过程与语音信号不同,且存在显著的跨用户和跨会话的领域偏移。其次,数据集在构建过程中遇到的挑战包括数据收集的繁琐性、缺乏大规模数据集以及用户间生理和行为差异的显著性。这些挑战要求模型具有强大的泛化能力和数据高效性,以应对不同用户和会话间的差异。
常用场景
经典使用场景
emg2qwerty数据集的经典使用场景主要集中在利用表面肌电图(sEMG)信号进行触摸打字的研究。通过分析手腕处记录的sEMG信号,研究者可以预测用户在QWERTY键盘上的按键动作。这一任务与自动语音识别(ASR)领域密切相关,因为两者都涉及将连续的高维特征序列转换为字符或单词序列。数据集的丰富性和大规模特性使其成为开发和验证新型人机交互技术的理想平台。
实际应用
emg2qwerty数据集的实际应用场景广泛,特别是在增强现实(AR)和虚拟现实(VR)环境中。在这些环境中,传统的输入设备如键盘和鼠标可能不便使用,而基于sEMG的输入系统可以提供一种低摩擦、高带宽的文本输入方式。此外,这种技术还可以应用于移动计算设备,如智能手机和平板电脑,提供一种无需物理键盘的文本输入解决方案。对于残障人士,特别是那些失去肢体功能的用户,这种技术可以作为一种辅助工具,帮助他们恢复与外界的交流能力。
衍生相关工作
emg2qwerty数据集的发布催生了一系列相关研究工作。首先,许多研究者利用该数据集开发了新的模型和算法,以提高sEMG信号的解码精度和实时性。其次,数据集的开放性促进了跨学科的合作,特别是在机器学习、神经科学和人机交互领域。此外,基于该数据集的研究成果还被应用于开发新的神经接口技术,如脑机接口(BCI)和神经假肢。这些衍生工作不仅推动了基础科学研究,还为实际应用提供了技术支持。
以上内容由遇见数据集搜集并总结生成



