ymoslem/Wikimedia-Speech-Irish
收藏Hugging Face2024-07-02 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/ymoslem/Wikimedia-Speech-Irish
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个合成的音频数据集,使用Azure文本到语音服务创建。双语文本来自Wikimedia数据集的一部分,包含7,545个文本片段。数据集包括两种语音数据,一种是女性声音(OrlaNeural),另一种是男性声音(ColmNeural)。语音数据总时长约为34小时23分钟,分布在15,090个话语中。数据集的结构包括音频、爱尔兰语文本和英语文本三个特征。
该数据集是一个合成的音频数据集,使用Azure文本到语音服务创建。双语文本来自Wikimedia数据集的一部分,包含7,545个文本片段。数据集包括两种语音数据,一种是女性声音(OrlaNeural),另一种是男性声音(ColmNeural)。语音数据总时长约为34小时23分钟,分布在15,090个话语中。数据集的结构包括音频、爱尔兰语文本和英语文本三个特征。
提供机构:
ymoslem
原始信息汇总
数据集概述
数据集信息
- 特征:
audio: 音频数据text_ga: 字符串类型,盖尔语文本text_en: 字符串类型,英语文本
数据集结构
- 数据集对象:
- 特征: [audio, text_ga, text_en]
- 行数: 15090
数据集分割
- 训练集:
- 字节数: 4209155993.0
- 示例数: 15090
数据集大小
- 下载大小: 3452146050
- 数据集总大小: 4209155993.0
配置
- 默认配置:
- 数据文件路径:
data/train-*
- 数据文件路径:
数据集描述
- 创建方式: 使用Azure文本到语音服务生成的合成音频数据
- 语言: 双语,包含盖尔语和英语
- 音频数据: 分为女性声音(OrlaNeural)和男性声音(ColmNeural)两类



