Bukva
收藏github2024-06-10 更新2024-06-22 收录
下载链接:
https://github.com/ai-forever/bukva
下载链接
链接失效反馈官方服务:
资源简介:
Bukva是一个用于俄罗斯手指字母识别任务的视频数据集,包含约27GB大小,3757个RGB视频,每个RSL字母手势超过101个样本,包括动态手势。数据集被分为训练集和测试集,总录制时间约4小时,其中约17%的视频为HD格式,70%为FullHD分辨率。
Bukva is a video dataset designed for Russian finger alphabet recognition tasks. It has a total size of approximately 27 GB, consisting of 3757 RGB videos, with over 101 samples per RSL (Russian Sign Language) finger alphabet gesture, including dynamic gestures. The dataset is divided into a training set and a test set, with a total recording duration of about 4 hours. Approximately 17% of the videos are in HD format, while 70% are in FullHD resolution.
创建时间:
2024-06-03
原始信息汇总
Bukva: Russian Sign Language Alphabet Dataset
数据集概述
- 名称: Bukva
- 大小: 约27 GB
- 视频数量: 3757个RGB视频
- 样本数量: 每个俄罗斯手语字母符号超过101个样本
- 视频时长: 总计约4小时
- 分辨率: 17%为HD格式,70%为FullHD分辨率
- 划分: 训练集包含3097个视频,测试集包含660个视频
数据结构
- 原始视频: 包含原始视频文件
- 修剪视频: 包含修剪后的视频文件
- 标注文件:
annotations.tsv,包含以下列:attachment_id: 视频文件名user_id: 匿名用户IDtext: 手势类别(俄语)begin: 手势开始时间(原始数据集)end: 手势结束时间(原始数据集)height: 视频高度width: 视频宽度train: 训练或测试标志length: 视频长度
下载
- 链接: dataset
- 大小: 约27 GB
- 内容: 原始HD+视频、修剪HD+视频、标注文件
预训练模型
- 模型名称: MobileNetV2_TSM
- 模型大小: 9.1 MB
- 性能指标: 83.6
- 权重文件: weights
搜集汇总
数据集介绍

构建方式
在构建Bukva数据集时,研究者们精心收集了3757个RGB视频,涵盖了俄罗斯手语字母表中的所有动态和静态手势。这些视频被分为训练集和测试集,分别包含3097和660个视频,通过用户ID进行分割,确保数据集的多样性和代表性。视频总时长约为4小时,其中约17%为高清格式,70%为全高清分辨率。此外,数据集还包括详细的注释文件,提供了手势的起始和结束时间、视频分辨率等信息,便于后续的模型训练和评估。
特点
Bukva数据集的显著特点在于其丰富的视频内容和高分辨率的质量,这为手语识别任务提供了高质量的训练数据。数据集的注释文件设计简洁且实用,包含了手势类别、视频分辨率等关键信息,极大地简化了数据处理流程。此外,数据集的多样性通过不同用户的视频录制得以体现,确保了模型的泛化能力。
使用方法
使用Bukva数据集时,用户首先需下载并解压数据集文件。随后,可以通过提供的注释文件将视频数据转换为适合模型训练的格式。借助如MMAction2等框架,用户可以轻松配置训练环境,并根据需求选择合适的模型进行训练。数据集还提供了预训练模型,用户可以直接使用这些模型进行手语识别任务,或在此基础上进行进一步的微调。
背景与挑战
背景概述
Bukva数据集是由Kvanchiani Karina、Surovtsev Petr、Nagaev Alexander、Petrova Elizaveta和Kapitanov Alexander等研究人员于2024年创建,专注于俄罗斯手语(RSL)字母的识别任务。该数据集包含约27GB的RGB视频,涵盖3757个视频样本,每个RSL字母符号有超过101个样本,包括动态手势。Bukva数据集的构建旨在推动手语识别技术的发展,特别是针对俄罗斯手语的字母识别,为相关领域的研究提供了丰富的资源和基准。
当前挑战
Bukva数据集在构建过程中面临多项挑战。首先,收集和标注大量高质量的手语视频数据是一项复杂且耗时的任务,尤其是需要确保每个手势的准确性和多样性。其次,数据集中的视频分辨率多样,从HD到FullHD不等,这增加了模型训练的难度。此外,动态手势的识别需要处理视频序列中的时间依赖性,这对模型的设计和训练提出了更高的要求。最后,数据集的分割和标注文件的生成也需要精确处理,以确保训练和测试集的合理性和有效性。
常用场景
经典使用场景
在手语识别领域,Bukva数据集以其丰富的视频资源和详细的注释文件,成为俄罗斯手语字母识别任务的经典数据集。该数据集包含3757个RGB视频,涵盖了俄罗斯手语字母的静态和动态手势,为研究人员提供了宝贵的训练和测试资源。通过将数据集划分为训练集和测试集,研究人员可以有效地评估和优化手语识别模型,从而推动该领域的发展。
解决学术问题
Bukva数据集在学术研究中解决了俄罗斯手语字母识别的关键问题。通过提供高质量的视频数据和详细的注释,该数据集使得研究人员能够开发和验证手语识别算法,从而提高识别准确率和鲁棒性。此外,数据集的多样性和规模也为跨学科研究提供了基础,促进了计算机视觉和语言学领域的交叉研究,具有重要的学术价值和影响力。
衍生相关工作
基于Bukva数据集,研究人员已开展了一系列相关工作,包括手语识别模型的优化、多模态数据融合以及实时手语翻译系统的设计。例如,通过结合深度学习和时间序列分析,研究者们提出了多种改进的手语识别算法,显著提高了识别精度。此外,该数据集还激发了对手语语言学特征的深入研究,推动了手语理解和生成技术的发展。
以上内容由遇见数据集搜集并总结生成



