Splend1dchan/librispeech_asr_individual

Name: Splend1dchan/librispeech_asr_individual
Creator: Splend1dchan
Published: 2023-06-25 15:57:52
License: 暂无描述

Hugging Face2023-06-25 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/Splend1dchan/librispeech_asr_individual

下载链接

链接失效反馈

官方服务：

资源简介：

LibriSpeech是一个包含约1000小时16kHz英语朗读语音的语料库，数据来源于LibriVox项目的有声读物，并经过精心分段和对齐。该数据集支持自动语音识别（ASR）和音频说话人识别任务，包含两个配置：clean和other。clean配置的语音质量较高，口音更接近美式英语，而other配置的语音质量相对较低。数据集的结构包括音频文件路径、音频数据、文本转录、说话人ID、章节ID和唯一ID等信息。数据集分为训练集、验证集和测试集，训练集进一步分为train.100、train.360和train.500。

提供机构：

Splend1dchan

原始信息汇总

数据集概述

名称: LibriSpeech

语言: 英语（en）

许可证: CC-BY-4.0

多语言性: 单语种（monolingual）

任务类别:

自动语音识别（automatic-speech-recognition）
音频分类（audio-classification）

任务ID: 说话人识别（speaker-identification）

数据集大小: 100K<n<1M

源数据: 原始数据（original）

数据集结构

特征

file: 字符串类型，音频文件路径。
audio: 音频类型，采样率为16000 Hz。
text: 字符串类型，音频转录文本。
speaker_id: 整数类型，说话人唯一标识。
chapter_id: 整数类型，有声书章节唯一标识。
id: 字符串类型，数据样本唯一标识。

数据分割

clean配置:
- train.100: 28539个样本，6619683041字节。
- train.360: 104014个样本，23898214592字节。
- validation: 2703个样本，359572231字节。
- test: 2620个样本，367705423字节。
- 下载大小: 30121377654字节。
- 数据集大小: 31245175287字节。
other配置:
- train.500: 148688个样本，31810256902字节。
- validation: 2864个样本，337283304字节。
- test: 2939个样本，352396474字节。
- 下载大小: 31236565377字节。
- 数据集大小: 32499936680字节。
all配置:
- 下载大小: 61357943031字节。
- 数据集大小: 63826462287字节。