five

ymoslem/Wikimedia-Speech-Irish

收藏
Hugging Face2024-07-02 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/ymoslem/Wikimedia-Speech-Irish
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个合成的音频数据集,使用Azure文本到语音服务创建。双语文本来自Wikimedia数据集的一部分,包含7,545个文本片段。数据集包括两种语音数据,一种是女性声音(OrlaNeural),另一种是男性声音(ColmNeural)。语音数据总时长约为34小时23分钟,分布在15,090个话语中。数据集的结构包括音频、爱尔兰语文本和英语文本三个特征。

该数据集是一个合成的音频数据集,使用Azure文本到语音服务创建。双语文本来自Wikimedia数据集的一部分,包含7,545个文本片段。数据集包括两种语音数据,一种是女性声音(OrlaNeural),另一种是男性声音(ColmNeural)。语音数据总时长约为34小时23分钟,分布在15,090个话语中。数据集的结构包括音频、爱尔兰语文本和英语文本三个特征。
提供机构:
ymoslem
原始信息汇总

数据集概述

数据集信息

  • 特征:
    • audio: 音频数据
    • text_ga: 字符串类型,盖尔语文本
    • text_en: 字符串类型,英语文本

数据集结构

  • 数据集对象:
    • 特征: [audio, text_ga, text_en]
    • 行数: 15090

数据集分割

  • 训练集:
    • 字节数: 4209155993.0
    • 示例数: 15090

数据集大小

  • 下载大小: 3452146050
  • 数据集总大小: 4209155993.0

配置

  • 默认配置:
    • 数据文件路径: data/train-*

数据集描述

  • 创建方式: 使用Azure文本到语音服务生成的合成音频数据
  • 语言: 双语,包含盖尔语和英语
  • 音频数据: 分为女性声音(OrlaNeural)和男性声音(ColmNeural)两类
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作