how2sign-asl-clips
收藏数据集概述
how2sign-asl-clips 是一个为 EPFL CS-503 hand2string 项目构建的句子级别剪辑数据集,源自 How2Sign 美国手语(ASL)数据集。
基本信息
- 许可证: CC BY-NC 4.0
- 任务类型: 视频分类、翻译
- 语言: 英语
- 标签: 手语、ASL、How2Sign
- 数据规模: 少于 10K 条样本
数据内容
该数据集为 How2Sign 数据集中的句子级别视频片段,根据 how2sign_realigned_train.csv 中的重新对齐时间戳进行剪辑。当前版本(进行中)包含:
- 351个源视频
- 4991个视频片段
数据模式(metadata.parquet)
数据集包含一个 Parquet 格式的元数据文件,其字段如下:
| 列名 | 类型 | 说明 |
|---|---|---|
| sentence_id | 字符串 | 主键,例如 --7E2sU6zP4_10 |
| sentence_name | 字符串 | 完整的 How2Sign 剪辑名称(含摄像头标签) |
| video_id | 字符串 | 父视频的 YouTube ID |
| video_name | 字符串 | 源 mp4 文件名(不含扩展名) |
| start | 浮点数 | 在源视频中的起始时间(秒) |
| end | 浮点数 | 在源视频中的结束时间(秒) |
| duration | 浮点数 | 持续时间 = end - start(秒) |
| sentence | 字符串 | 英语转录文本 |
| split | 字符串 | 数据集划分 |
| file_name | 字符串 | 相对于仓库根目录的剪辑路径 |
快速使用
可通过 huggingface_hub 的 snapshot_download 下载数据集,并使用 pandas 读取元数据文件:
python from huggingface_hub import snapshot_download import pandas as pd from pathlib import Path
local = Path(snapshot_download("martinctl/how2sign-asl-clips", repo_type="dataset")) df = pd.read_parquet(local / "metadata.parquet")
row = df.iloc[0] print(row.sentence) clip = local / row.file_name # 可播放的 mp4 文件
引用
How2Sign 原始数据集引用:
Duarte, A., Palaskar, S., Ventura, L., Ghadiyaram, D., DeHaan, K., Metze, F., Torres, J., Giró-i-Nieto, X. How2Sign: A Large-scale Multimodal Dataset for Continuous American Sign Language. CVPR 2021.




