five

mms-tts-uig-script_arabic-UQSpeech|文本到语音转换数据集|维吾尔语数据集

收藏
huggingface2024-12-25 更新2024-12-26 收录
文本到语音转换
维吾尔语
下载链接:
https://huggingface.co/datasets/ixxan/mms-tts-uig-script_arabic-UQSpeech
下载链接
链接失效反馈
资源简介:
该数据集名为Single Speaker Uyghur Quran Recordings,包含维吾尔语的单说话者古兰经录音。数据集的特征包括音频路径和句子文本,音频采样率为16000Hz。数据集只有一个训练分割,包含16183个样本,总大小为4345803734.966字节。数据集的任务类别是文本到语音转换,语言为维吾尔语(ug)。数据集来自GitHub上的UQSpeechDataset项目,作者为Gheyret Kenji,发布于2019年。
创建时间:
2024-12-25
AI搜集汇总
数据集介绍
main_image_url
构建方式
该数据集来源于UQSpeech项目,由Gheyret Kenji于2019年创建,旨在提供高质量的维吾尔语《古兰经》朗读录音。数据集的构建过程包括从公开资源中收集音频文件,并对其进行标准化处理,确保音频采样率为16000Hz。每个音频文件均配有对应的文本句子,形成了音频与文本的配对数据。数据集以训练集的形式发布,包含16183个样本,总大小约为4.35GB。
特点
该数据集的核心特点在于其专注于单一说话者的维吾尔语《古兰经》朗读录音,具有高度的语言和文化特异性。音频文件的采样率为16000Hz,确保了音质的清晰度与一致性。每个音频文件均与对应的文本句子精确匹配,为文本到语音(TTS)任务提供了高质量的标注数据。数据集的规模适中,适合用于训练和评估维吾尔语TTS模型,同时也为语言学和语音学研究提供了宝贵的资源。
使用方法
该数据集主要用于文本到语音(TTS)任务的训练与评估。用户可以通过加载数据集中的音频文件及其对应的文本句子,构建TTS模型的输入输出对。由于数据集已标准化处理,用户可直接使用其提供的音频采样率和文本格式,无需额外预处理。此外,数据集还可用于维吾尔语语音合成技术的研究与开发,以及跨语言语音模型的迁移学习实验。通过结合深度学习框架,用户能够高效地利用该数据集进行模型训练与性能优化。
背景与挑战
背景概述
mms-tts-uig-script_arabic-UQSpeech数据集由Gheyret Kenji于2019年创建,主要聚焦于维吾尔语的文本到语音(TTS)转换任务。该数据集的核心研究问题在于如何高效地将维吾尔语文本转化为自然流畅的语音输出,特别是在宗教文本如《古兰经》的诵读场景中。数据集包含了16183条训练样本,采样率为16000Hz,总大小约为4.3GB。这一数据集的发布为维吾尔语语音合成领域提供了宝贵的资源,推动了该语言在语音技术中的应用与发展。
当前挑战
mms-tts-uig-script_arabic-UQSpeech数据集面临的挑战主要体现在两个方面。首先,维吾尔语作为一种低资源语言,其语音数据的稀缺性使得模型的训练和优化变得尤为困难,尤其是在保持语音的自然性和准确性方面。其次,数据集的构建过程中,如何确保录音质量的一致性以及文本与语音的精确对齐,也是一个技术难点。此外,宗教文本的特殊性要求语音合成模型在发音和语调上具备更高的精确度,这进一步增加了数据处理的复杂性。
常用场景
经典使用场景
在语音合成领域,mms-tts-uig-script_arabic-UQSpeech数据集为研究者提供了一个高质量的维吾尔语单说话者语音样本库。该数据集特别适用于开发基于深度学习的文本到语音(TTS)系统,尤其是在处理维吾尔语这种资源相对稀缺的语言时,能够显著提升模型的准确性和自然度。
解决学术问题
该数据集有效解决了维吾尔语语音合成研究中数据稀缺的问题。通过提供大量高质量的语音样本,研究者能够更深入地探索维吾尔语的语音特性,优化语音合成模型的表现。这不仅推动了维吾尔语语音技术的发展,也为其他低资源语言的语音合成研究提供了宝贵的参考。
衍生相关工作
基于该数据集,研究者们已经开发了多种先进的维吾尔语语音合成模型。这些模型在语音质量、自然度和适应性方面取得了显著进展,进一步推动了维吾尔语语音技术的研究和应用。此外,该数据集还激发了更多关于低资源语言语音合成的研究,促进了该领域的多元化发展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

PadChest-GR dataset

<div> <div>PadChest-GR is a manually annotated, bilingual chest X-ray dataset designed to train and evaluate models for grounded radiology report generation. It includes bounding boxes and comprehensive annotations of all clinically relevant findings.</div> </div>

微软开源数据集 收录

flames-and-smoke-datasets

该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。

github 收录

Plant-Diseases

Dataset for Plant Diseases containg variours Plant Disease

kaggle 收录

Human3.6M

多样性和大小 • 360 万张 3D 人体姿势和相应图像 • 11 位专业演员(6 男,5 女) • 17 种场景(讨论、吸烟、拍照、打电话……) 准确捕捉和同步 • 高分辨率来自 4 个校准摄像机的 50Hz 视频 • 来自高速运动捕捉系统的准确 3D 关节位置和关节角度 • 每种配置的像素级 24 个身体部位标签 • 飞行时间范围数据。

OpenDataLab 收录

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录