BD-4SK-ASR (Basic Dataset for Sorani Kurdish Automatic Speech Recognition)
收藏OpenDataLab2026-05-31 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/BD-4SK-ASR
下载链接
链接失效反馈官方服务:
资源简介:
The Basic Dataset for Sorani Kurdish Automatic Speech Recognition (BD-4SK-ASR) 是一个用于 Sorani Kurdish 自动语音识别的数据集。我们提出了一个实验数据集,即 Sorani Kurdish 自动语音识别基本数据集 (BD-4SK-ASR),它我们第一次尝试为 Sorani Kurdish 开发自动语音识别。该项目的目标是开发一个系统,该系统可以根据伊拉克库尔德斯坦地区小学一到三年级使用的词汇自动识别简单的句子。我们使用 CMUSphinx 作为我们的实验环境。我们开发了一个数据集来训练系统。该数据集在 CC BY-NC-SA 4.0 许可下可公开用于非商业用途。
The Basic Dataset for Sorani Kurdish Automatic Speech Recognition (BD-4SK-ASR) is a dataset dedicated to Sorani Kurdish automatic speech recognition. We propose an experimental dataset, the Basic Dataset for Sorani Kurdish Automatic Speech Recognition (BD-4SK-ASR), which marks our first attempt to develop automatic speech recognition systems for Sorani Kurdish. The goal of this project is to build a system that can automatically recognize simple sentences using vocabulary taught in grades 1 through 3 of primary schools in the Iraqi Kurdistan Region. We utilized CMUSphinx as our experimental framework. We constructed this dataset for system training purposes. This dataset is publicly available for non-commercial use under the CC BY-NC-SA 4.0 license.
提供机构:
OpenDataLab
创建时间:
2022-06-23
搜集汇总
数据集介绍

背景与挑战
背景概述
BD-4SK-ASR是一个用于Sorani Kurdish自动语音识别的实验数据集,首次尝试为该语言开发识别系统,旨在基于小学低年级词汇识别简单句子。数据集在CC BY-NC-SA 4.0许可下公开,适用于非商业用途,由库尔德斯坦休勒大学于2019年发布。
以上内容由遇见数据集搜集并总结生成



