ymoslem/Living-Audio-Irish

Name: ymoslem/Living-Audio-Irish
Creator: ymoslem
Published: 2024-05-04 18:08:22
License: 暂无描述

Hugging Face2024-05-04 更新2024-05-25 收录

下载链接：

https://hf-mirror.com/datasets/ymoslem/Living-Audio-Irish

下载链接

链接失效反馈

官方服务：

资源简介：

Living Audio Irish语音语料库。此版本基于Kaggle上的爱尔兰数据集。原始数据集包含更多语言的音频，作为Idlak项目的一部分在GitHub上提供。爱尔兰部分的Living Audio数据集详细信息如下：说话者CLL，语言为爱尔兰语（ga），口音为非本地（ie），性别为男性，总时长为61:56，采样率为48,000Hz。数据集包含两个主要特征：sentence（文本）和audio（音频），音频的采样率为48000Hz。数据集分为一个训练集，包含1121个样本，总大小为330598119.934字节。数据集的下载大小为351795253字节。数据集的语言为爱尔兰语（ga），适用于自动语音识别和文本到语音转换任务。

提供机构：

ymoslem

原始信息汇总

数据集概述

基本信息

数据集名称: Living Audio Irish speech corpus
数据集大小: 330598119.934 字节
下载大小: 351795253 字节
样本数量: 1121
语言: 爱尔兰语 (ga)
任务类别:
- 自动语音识别
- 文本到语音
大小类别: 1K<n<10K
许可证: Apache-2.0

数据集结构

特征:
- sentence: 字符串类型
- audio: 音频类型，采样率为48000 Hz
分割:
- train: 1121个样本，330598119.934字节

数据集加载

python from datasets import load_dataset

living_audio_dataset = load_dataset("ymoslem/Living-Audio-Irish", split="train", trust_remote_code=True)

引用信息

@inproceedings{braude19_interspeech, author={David A. Braude and Matthew P. Aylett and Caoimhín Laoide-Kemp and Simone Ashby and Kristen M. Scott and Brian Ó Raghallaigh and Anna Braudo and Alex Brouwer and Adriana Stan}, title={{All Together Now: The Living Audio Dataset}}, year=2019, booktitle={Proc. Interspeech 2019}, pages={1521--1525}, doi={10.21437/Interspeech.2019-2448} }

5,000+

优质数据集

54 个

任务类型

进入经典数据集