how2sign-preprocessed-skels

Hugging Face2025-09-15 更新2025-09-16 收录

下载链接：

https://huggingface.co/datasets/lilyam7/how2sign-preprocessed-skels

下载链接

链接失效反馈

官方服务：

资源简介：

How2sign数据集的骨骼文件：包含面部、身体和手的3D关键点

创建时间：

2025-09-12

原始信息汇总

数据集概述

基本信息

任务类别: 特征提取
语言: 英语
标签: 语言、手语生成、手语、手语
数据集名称: Skels File for How2sign Dataset: face, body and hands 3D Keypoints
数据规模: 10K至100K之间

数据集详情

内容: 包含How2sign数据集中人脸、身体和手部的3D关键点骨架文件

搜集汇总

数据集介绍

构建方式

在计算机视觉与手语计算领域，how2sign-preprocessed-skels数据集通过系统化的多模态数据处理流程构建而成。其核心步骤包括从原始How2Sign视频中提取人体关键点信息，并利用先进的姿态估计算法生成三维坐标数据，涵盖面部、身体及手部运动轨迹。数据处理过程中采用了严格的坐标归一化和时序对齐策略，确保空间一致性与动作连贯性。

使用方法

研究者可借助该数据集开展手语生产、动作生成及跨模态翻译等任务。使用时需加载预处理的骨骼序列文件，结合对应的语音文本标注进行模型训练。建议采用时序建模网络如LSTM或Transformer处理关键点序列，同时注意利用数据集提供的三维坐标信息增强空间建模能力。验证阶段应遵循标准的数据划分方案以确保结果可比性。

背景与挑战

背景概述

手语计算作为人机交互与无障碍技术的重要分支，how2sign-preprocessed-skels数据集由卡耐基梅隆大学等机构于2021年推出，聚焦于美国手语的三维姿态建模。该数据集通过提取人体面部、躯干及手部的三维关键点，为手语生成与识别研究提供了结构化数据支撑，显著推动了多模态人机交互与聋哑人群辅助技术的发展。

当前挑战

该数据集需解决连续手语动作中细粒度手势分割与跨模态对齐的复杂性，同时克服原始视频数据中遮挡、光照变异及视角多样性带来的三维关键点提取误差。构建过程中面临多视角相机标定同步、关键点标注一致性维护，以及大规模数据处理中的计算资源约束等工程挑战。

常用场景

经典使用场景

在计算机视觉与手语识别领域，how2sign-preprocessed-skels数据集为研究三维人体关键点动态建模提供了重要支撑。该数据集通过提取面部、身体及手部的三维关键点信息，广泛应用于连续手语识别模型的训练与验证，尤其在基于骨架动作序列的深度学习算法开发中占据核心地位。

解决学术问题

该数据集有效解决了手语识别中因视觉外观变化、光照条件和背景干扰导致的特征提取难题。通过提供高精度三维关键点数据，它显著提升了模型对复杂手语动作的时空建模能力，推动了跨模态理解、人体运动分析及无障碍通信技术等学术方向的发展。

实际应用

在实际应用中，该数据集为开发实时手语翻译系统、智能辅助通信工具及沉浸式人机交互界面提供了数据基础。其提取的三维骨架信息可集成于AR/VR环境，用于教育培训、聋健沟通辅助和影视娱乐中的虚拟角色动作生成，具有较强的工程落地潜力。

数据集最近研究