ymoslem/Wikimedia-Speech-Irish

Name: ymoslem/Wikimedia-Speech-Irish
Creator: ymoslem
Published: 2024-07-02 05:21:41
License: 暂无描述

Hugging Face2024-07-02 更新2024-05-25 收录

下载链接：

https://hf-mirror.com/datasets/ymoslem/Wikimedia-Speech-Irish

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个合成的音频数据集，使用Azure文本到语音服务创建。双语文本来自Wikimedia数据集的一部分，包含7,545个文本片段。数据集包括两种语音数据，一种是女性声音（OrlaNeural），另一种是男性声音（ColmNeural）。语音数据总时长约为34小时23分钟，分布在15,090个话语中。数据集的结构包括音频、爱尔兰语文本和英语文本三个特征。

提供机构：

ymoslem

原始信息汇总

数据集概述

数据集信息

特征:
- audio: 音频数据
- text_ga: 字符串类型，盖尔语文本
- text_en: 字符串类型，英语文本

数据集结构

数据集对象:
- 特征: [audio, text_ga, text_en]
- 行数: 15090

数据集分割

训练集:
- 字节数: 4209155993.0
- 示例数: 15090

数据集大小

下载大小: 3452146050
数据集总大小: 4209155993.0

配置

默认配置:
- 数据文件路径: data/train-*

数据集描述

创建方式: 使用Azure文本到语音服务生成的合成音频数据
语言: 双语，包含盖尔语和英语
音频数据: 分为女性声音（OrlaNeural）和男性声音（ColmNeural）两类

5,000+

优质数据集

54 个

任务类型

进入经典数据集