Forearm sEMG Gesture Dataset
收藏github2026-04-26 更新2026-04-27 收录
下载链接:
https://github.com/Hunter-qing/Forearm-sEMG-Gesture-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含来自30名受试者的8通道表面肌电(sEMG)信号,用于手势识别。受试者执行五种手势和一种休息状态试验。每个试验持续5秒,信号采样率为200Hz,文件格式为MATLAB .mat。
This dataset contains 8-channel surface electromyography (sEMG) signals from 30 subjects, intended for gesture recognition. The subjects complete five gesture tasks and one rest-state trial. Each trial lasts 5 seconds, with a signal sampling rate of 200 Hz, and the files are stored in MATLAB .mat format.
创建时间:
2026-04-26
原始信息汇总
数据集概述:前臂表面肌电手势数据集
基本信息
- 信号类型:表面肌电信号 (sEMG)
- 采集位置:前臂肌肉
- 采集设备:MYO 臂环 (MYO Armband)
- 被试数量:30 人
- 每位被试的会话次数:5 次
- 通道数:8 通道
- 采样率:200 Hz
- 每次试验时长:5 秒
- 每通道采样点数:1000
- 文件格式:MATLAB
.mat
手势类别
该数据集包含 5 种手势和 1 种放松状态,标签定义如下:
| 标签 | 手势 | 中文 |
|---|---|---|
| 0 | Rest | 放松 |
| 1 | Fist | 握拳 |
| 2 | Open Palm | 伸掌 |
| 3 | Left Wrist Deviation | 左撇 |
| 4 | Right Wrist Deviation | 右撇 |
| 5 | Thumbs Up | 竖大拇指 |
数据结构
每个 .mat 文件记录一次完整的 5 秒手势试验,包含两个变量:
| 变量 | 描述 |
|---|---|
emg |
8 通道 EMG 信号,形状为 1000 × 8 |
label |
手势标签 |
每次试验包含三个阶段:
- 运动前的放松状态
- 从放松到手势的过渡阶段
- 维持手势状态
文件组织
数据集按以下目录结构组织:
text datasets/ ├── subject_001/ │ ├── session_01/ │ │ ├── gesture_1_01.mat │ │ ├── gesture_1_02.mat │ │ ├── gesture_2_01.mat │ │ ├── gesture_3_01.mat │ │ ├── gesture_4_01.mat │ │ ├── gesture_5_01.mat │ │ ├── rest_01.mat │ │ └── ... │ ├── session_02/ │ └── ... ├── subject_002/ └── ...
文件命名规则
- 手势文件:
gesture_[label]_[trial_index].mat,例如gesture_1_01.mat表示手势 1(握拳)的第 1 次试验 - 放松文件:
rest_[trial_index].mat,例如rest_01.mat表示第 1 次放松试验
手势示例
数据集包含五种手势的示例图片:握拳、伸掌、左撇、右撇和竖大拇指。
提供的辅助脚本
- 手势起始对齐脚本 (
scripts/align_onset.py):考虑到每位被试反应时间不同,统一保留 EMG 信号显著变化前的 20 个采样点,并截去多余部分。 - MATLAB 预处理脚本 (
scripts/matlab/):提供将原始.mat文件转换为 H5 文件的脚本,采用滑动窗口方法,包含:extract_windows_from_mat.mbatch_convert_to_h5.m
隐私声明
所有被试身份信息均已匿名化,不包含姓名、学号、电话号码、电子邮件或其他可直接识别的个人信息,禁止任何用户尝试重新识别被试身份。
建议用途
- 基于肌电信号的手势识别
- 手势分类
- 人机交互研究
- 信号处理与机器学习实验
许可协议
- 数据集:Creative Commons Attribution 4.0 International License (CC BY 4.0)
- MATLAB 预处理脚本:MIT License
搜集汇总
数据集介绍

构建方式
该数据集基于表面肌电图技术,面向手势识别研究领域构建。数据采集使用MYO臂环设备,以200 Hz采样率记录了30名受试者前臂8个通道的肌电信号。每名受试者完成5个session,每个session包含5种手势及放松状态,每次试验持续5秒,每通道产生1000个采样点。原始数据以MATLAB的.mat格式存储,文件包含emg信号矩阵与label标签变量。手势包括握拳、伸掌、左撇、右撇和竖大拇指,分别对应1至5的标签,标签0代表放松状态。数据集在采集后还提供了起始对齐脚本,统一截取肌电信号显著变化前的20个采样点,消除个体反应时差异,保证时间一致性。
特点
该数据集具有多维度特点。在规模上,涵盖30名受试者、每名5个session的重复测量,提供了充足样本以支撑机器学习模型的训练与泛化。在信号质量上,采用8通道高密度采集和200 Hz采样,能够精细捕捉前臂肌肉活动时序模式。手势设计兼顾基础动作与功能性指令,涵盖握拳、伸掌、左右手腕偏移和竖大拇指,贴近人机交互实际场景。数据文件命名规范、目录结构清晰,便于批量处理。同时,所有受试者身份均已匿名化,确保隐私合规。
使用方法
该数据集适用于肌电信号分析与手势识别研究。用户可直接加载.mat文件,读取emg信号矩阵与label标签进行特征提取与分类建模。为便于大规模处理,仓库提供了MATLAB脚本,支持滑动窗口方式将原始文件批量转换为H5格式。起始对齐脚本亦可作为预处理步骤,帮助统一各试验的起始点。数据集可应用于手势分类、人机交互、信号处理与机器学习实验等多个方向,用户需在使用时遵循CC BY 4.0许可协议并引用相关来源。
背景与挑战
背景概述
表面肌电信号(sEMG)作为人机交互领域的重要生物电信号,因其非侵入性、易于采集等优势,在手部动作识别与智能假肢控制等方向展现出广阔的应用前景。Forearm sEMG Gesture Dataset由Hu Yongcheng与Hu Shuai于2026年创建并发布,旨在为基于前臂肌电信号的手势识别研究提供标准化的数据支撑。该数据集采集自30名受试者,利用MYO臂环以200 Hz采样率记录8通道sEMG信号,涵盖握拳、伸掌、左右手腕偏转及竖拇指五种手势与放松状态,每位受试者完成5个实验轮次。该数据集的提出有效弥合了现有sEMG手势数据库在样本规模、协议规范化方面的不足,为手势分类算法的鲁棒性验证与跨个体泛化能力评估奠定了重要基础,推动了肌电控制技术向实际应用的转化。
当前挑战
该数据集面临的核心挑战在于多维度信号的复杂解耦与高精度识别。首先,前臂sEMG信号易受电极移位、肌肉疲劳、皮肤阻抗等生理因素干扰,导致同一手势在不同轮次或个体间呈现显著变异性,增加了手势类别间区分度构建的难度。其次,实验设计包含从放松到手势执行的过渡阶段,其非平稳瞬态信号与稳定态信号的混合使得时间序列建模面临跨阶段动态对齐问题。在构建过程中,由于各受试者反应时间不一,原始信号需实施精准的起始点对齐——仅保留肌电显著变化前20个采样点的基线数据,该预处理步骤对动作起点的识别算法提出了严苛要求。此外,仅5种手势的有限类别集难以覆盖真实人机交互场景的多样性,模型向细粒度或复杂组合动作的迁移仍需进一步探索。
常用场景
经典使用场景
表面肌电信号(sEMG)作为非侵入式神经肌肉活动的窗口,在人机交互与智能控制领域具有重要价值。Forearm sEMG Gesture Dataset专为基于前臂肌电信号的手势识别研究而设计,其经典使用场景包括利用8通道MYO臂环采集的时序信号,结合滑动窗口分割与机器学习或深度学习模型(如支持向量机、卷积神经网络或长短期记忆网络),对握拳、伸掌、左右手腕偏转以及竖大拇指等五种手势及放松状态进行实时分类与解码。该数据集的标准化采集流程和多试次结构为算法鲁棒性评估提供了坚实基础。
解决学术问题
该数据集针对手势识别研究中长期存在的多受试者泛化能力薄弱与肌电信号时序对齐困难等核心问题提供了解决方案。通过采集30名受试者在5个时段的肌电数据,研究者能够系统性地评估模型对个体间肌肉活动差异、电极位置偏移以及疲劳效应等变异的适应能力。内置的起始点对齐脚本(align_onset.py)巧妙消解了不同受试者反应时间差异对信号分段的影响,为后续特征提取与波形分析消除了关键噪声源,从而推动了基于sEMG的人机接口在非理想条件下鲁棒识别的理论进展。
衍生相关工作
围绕此数据集已衍生出多项具有启发性的研究工作。其一,研究者基于该数据集开发了时间卷积网络(TCN)与注意力机制的融合模型,在跨受试者手势识别中取得了领先的准确率。其二,利用其提供的MATLAB预处理脚本,后续工作成功验证了时域特征(如均方根与肌电积分值)与频域特征(如中值频率)在不同手势任务下的可分性。此外,该数据集还被用于对比研究传统机器学习与端到端深度学习在肌电信号分类中的效能边界,为人机交互领域的方法论迭代提供了标准化基准。
以上内容由遇见数据集搜集并总结生成



