Persian-Kids-Speech-Data-Set

github2022-05-16 更新2024-05-31 收录

下载链接：

https://github.com/DSP-UT/Persian-Kids-Speech-Data-Set

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含来自286名6至9岁儿童（141名女孩，145名男孩）的语音信号，经过人工检查和标注。最终形成一个包含162,395个样本，总时长33小时44分钟的数据库。该语音数据库特别适用于语音识别和语言学研究，全面涵盖了29个波斯语音素、118个音节、56个子词和711个单词。

This dataset comprises voice signals from 286 children aged 6 to 9 years (141 girls and 145 boys), which have been manually checked and annotated. It ultimately forms a database containing 162,395 samples, totaling 33 hours and 44 minutes. This voice database is particularly suitable for speech recognition and linguistic research, comprehensively covering 29 Persian phonemes, 118 syllables, 56 subwords, and 711 words.

创建时间：

2022-05-16

原始信息汇总

Persian-Kids-Speech-Data-Set

数据集概述

样本来源：286名儿童（141名女孩，145名男孩）的语音信号。
年龄范围：6至9岁。
数据量：162,395个样本，总时长33小时44分钟。
数据处理：手动检查和标注。
应用领域：语音识别和语言学研究。
内容组成：包含29个波斯语音素、118个音节、56个子词和711个单词。

数据集特点

全面覆盖了波斯语的语音元素。
适用于语音识别技术的研究和开发。
支持语言学领域的深入分析。

搜集汇总

数据集介绍

构建方式

Persian-Kids-Speech-Data-Set数据集通过采集286名6至9岁儿童（包括141名女孩和145名男孩）的语音信号构建而成。这些语音数据经过人工检查和标注，最终形成了一个包含162,395个样本、总时长为33小时44分钟的语音语料库。该语料库特别适用于语音识别和语言学领域的研究，涵盖了波斯语的所有29个音素、118个音节、56个子词和711个单词。

特点

该数据集的特点在于其广泛的覆盖范围和高质量的标注。它不仅包含了丰富的语音样本，还涵盖了波斯语的所有音素和音节，为研究者提供了全面的语音数据资源。此外，数据集中的语音样本来自不同性别的儿童，确保了数据的多样性和代表性。这些特点使得该数据集在语音识别和语言学研究中具有重要的应用价值。

使用方法

Persian-Kids-Speech-Data-Set数据集的使用方法主要包括数据加载、预处理和模型训练。研究者可以通过GitHub页面获取数据集，并使用Python等编程语言进行数据加载。在预处理阶段，可以对语音信号进行特征提取和降噪处理。随后，研究者可以利用这些数据训练语音识别模型或进行语言学分析。该数据集特别适用于基于循环神经网络的音素和音节识别研究，为语音识别技术的开发提供了坚实的基础。

背景与挑战

背景概述

Persian-Kids-Speech-Data-Set数据集由Khanzadi等人于2022年创建，旨在为波斯语儿童语音识别和语言学相关研究提供基础数据支持。该数据集收录了286名6至9岁儿童的语音信号，经过人工检查和标注，最终构建了一个包含162,395个样本、总时长达33小时44分钟的语音语料库。该语料库涵盖了波斯语的所有29个音素、118个音节、56个子词和711个单词，为语音识别系统的开发及语音学研究提供了丰富的数据资源。该数据集的研究成果已在《Journal of AI and Data Mining》等学术期刊发表，并在波斯语语音处理领域产生了重要影响。

当前挑战

Persian-Kids-Speech-Data-Set数据集在构建过程中面临多重挑战。首先，儿童语音数据的采集和标注具有较高的复杂性，儿童的发音不稳定且易受情绪和环境因素影响，导致数据质量难以控制。其次，波斯语音素和音节的多样性增加了数据标注的难度，需要语言学专家进行精细化的标注工作。此外，构建一个涵盖广泛语音特征的语料库需要大量的时间和资源投入，尤其是在数据清洗和标准化处理方面。这些挑战不仅体现在数据集的构建过程中，也对其在语音识别和语言学研究中应用的准确性和可靠性提出了更高的要求。

常用场景

经典使用场景

Persian-Kids-Speech-Data-Set数据集在语音识别和语言学研究中具有重要应用。该数据集包含了286名6至9岁儿童的语音信号，涵盖了29个波斯语音素、118个音节、56个子词和711个单词，为研究者提供了一个丰富的资源库，用于开发儿童语音识别系统和进行语音学研究。

衍生相关工作

基于Persian-Kids-Speech-Data-Set数据集，研究者已经开展了多项经典工作。例如，Khanzadi等人利用该数据集开发了基于循环神经网络的波斯语音素和音节识别系统，用于语音意识评估。这些研究不仅推动了波斯语语音识别技术的发展，还为儿童语音研究提供了新的方法和工具。

数据集最近研究