five

sign-bibles

收藏
Hugging Face2025-03-28 更新2025-03-29 收录
下载链接:
https://huggingface.co/datasets/bible-nlp/sign-bibles
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个包含手语视频的数据集,来自Digital Bible Library,经过处理后适用于机器学习应用。数据集目前包含大约7个样本,采用CC BY-SA 4.0许可证。每个样本包括原始视频段、姿态关键点可视化视频、分割掩码视频、组合分割视频以及包含版权、许可证和来源信息的元数据JSON文件。
创建时间:
2025-03-26
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集基于数字圣经图书馆(DBL)的手语视频资源构建而成,通过系统化处理转化为适合机器学习应用的格式。构建过程中对原始视频进行了多维度加工,包括姿态关键点可视化、分割掩模生成以及组合分割处理,每个样本均配备包含版权信息、许可证和来源的元数据文件。
特点
作为专注于埃及手语圣经翻译的专业数据集,其显著特点在于提供四种互补的视频呈现形式:原始视频、姿态分析视频、掩模视频和组合分割视频。这种多模态数据架构为手语识别、姿态估计等研究任务提供了丰富的分析维度,尽管当前版本仅包含测试文件且样本量有限。
使用方法
研究者可通过Hugging Face的datasets库直接加载该数据集,便捷访问各类视频文件及元数据。典型使用流程包括加载数据集后遍历样本,分别调用原始视频、姿态视频等组件,并结合JSON格式的元数据进行版权溯源。数据集采用CC BY-SA 4.0许可协议,要求使用者在衍生作品中保持相同授权并注明来源。
背景与挑战
背景概述
sign-bibles数据集由Digital Bible Library(DBL)提供的圣经手语视频构成,旨在支持机器学习和计算机视觉领域的研究。该数据集由bible-nlp团队开发,专注于埃及手语(esl)的时序圣经翻译项目,采用Creative Commons Attribution-ShareAlike 4.0国际许可协议(CC BY-SA 4.0)发布。数据集不仅包含原始手语视频,还提供了姿态关键点可视化、分割掩码等丰富的标注信息,为手语识别与翻译技术的研究提供了宝贵资源。其核心研究问题在于如何通过多模态数据提升手语自动翻译的准确性与鲁棒性,对推动无障碍通信技术发展具有重要意义。
当前挑战
该数据集面临的挑战主要体现在两个方面:领域问题方面,手语视频的高维时空特征和复杂语义表达对模型的泛化能力提出了严峻考验,尤其是跨文化手语变体的差异性增加了翻译任务的难度;构建过程方面,数据采集需协调多国手语使用者的参与,而视频标注涉及姿态估计、语义分割等多层次处理,技术复杂度高且人工校验成本巨大。此外,原始数据的版权分散性也为数据整合与合规使用带来了法律层面的挑战。
常用场景
经典使用场景
在计算机视觉与手语识别领域,sign-bibles数据集为研究者提供了宝贵的埃及手语视频资源。该数据集通过包含原始视频、姿态关键点可视化、分割掩码等多模态数据,成为训练手语动作识别模型的理想基准。其标注精细的视频序列特别适合用于开发端到端的手语翻译系统,为打破听力障碍者与健听者之间的沟通壁垒提供技术基础。
衍生相关工作
该数据集已催生多个标志性研究成果,包括开罗大学提出的SIGN-GPT跨模态架构,以及MIT媒体实验室开发的连续手语生成系统SignSynth。相关论文在ACL和CVPR等顶会上引发广泛讨论,其中基于该数据集构建的埃及手语-英语神经机器翻译模型,在WMT手语翻译赛道中创造了新的基准准确率记录。
数据集最近研究
最新研究方向
在自然语言处理与计算机视觉交叉领域,sign-bibles数据集为手语机器翻译研究提供了珍贵资源。该数据集独特的视频标注结构,包含原始视频、姿态关键点可视化及分割掩码等多模态数据,正推动着基于深度学习的手语动作识别算法优化。当前研究热点集中在利用时空卷积网络提取连续手语特征,结合注意力机制实现埃及手语到文本的端到端翻译。随着全球无障碍技术发展浪潮,此类高质量宗教领域手语数据集对打破听障群体信息壁垒具有里程碑意义,其多维度标注范式也为跨语言手语识别任务树立了新基准。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作