Splend1dchan/librispeech_asr_individual
收藏Hugging Face2023-06-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Splend1dchan/librispeech_asr_individual
下载链接
链接失效反馈官方服务:
资源简介:
LibriSpeech是一个包含约1000小时16kHz英语朗读语音的语料库,数据来源于LibriVox项目的有声读物,并经过精心分段和对齐。该数据集支持自动语音识别(ASR)和音频说话人识别任务,包含两个配置:clean和other。clean配置的语音质量较高,口音更接近美式英语,而other配置的语音质量相对较低。数据集的结构包括音频文件路径、音频数据、文本转录、说话人ID、章节ID和唯一ID等信息。数据集分为训练集、验证集和测试集,训练集进一步分为train.100、train.360和train.500。
LibriSpeech是一个包含约1000小时16kHz英语朗读语音的语料库,数据来源于LibriVox项目的有声读物,并经过精心分段和对齐。该数据集支持自动语音识别(ASR)和音频说话人识别任务,包含两个配置:clean和other。clean配置的语音质量较高,口音更接近美式英语,而other配置的语音质量相对较低。数据集的结构包括音频文件路径、音频数据、文本转录、说话人ID、章节ID和唯一ID等信息。数据集分为训练集、验证集和测试集,训练集进一步分为train.100、train.360和train.500。
提供机构:
Splend1dchan
原始信息汇总
数据集概述
名称: LibriSpeech
语言: 英语(en)
许可证: CC-BY-4.0
多语言性: 单语种(monolingual)
任务类别:
- 自动语音识别(automatic-speech-recognition)
- 音频分类(audio-classification)
任务ID: 说话人识别(speaker-identification)
数据集大小: 100K<n<1M
源数据: 原始数据(original)
数据集结构
特征
- file: 字符串类型,音频文件路径。
- audio: 音频类型,采样率为16000 Hz。
- text: 字符串类型,音频转录文本。
- speaker_id: 整数类型,说话人唯一标识。
- chapter_id: 整数类型,有声书章节唯一标识。
- id: 字符串类型,数据样本唯一标识。
数据分割
-
clean配置:
- train.100: 28539个样本,6619683041字节。
- train.360: 104014个样本,23898214592字节。
- validation: 2703个样本,359572231字节。
- test: 2620个样本,367705423字节。
- 下载大小: 30121377654字节。
- 数据集大小: 31245175287字节。
-
other配置:
- train.500: 148688个样本,31810256902字节。
- validation: 2864个样本,337283304字节。
- test: 2939个样本,352396474字节。
- 下载大小: 31236565377字节。
- 数据集大小: 32499936680字节。
-
all配置:
- 下载大小: 61357943031字节。
- 数据集大小: 63826462287字节。
数据集创建
注释创建者: 专家生成(expert-generated)
语言创建者:
- 众包(crowdsourced)
- 专家生成(expert-generated)
搜集汇总
数据集介绍

背景与挑战
背景概述
librispeech_asr_individual是一个大型英语语音识别数据集,包含约1000小时的16kHz朗读语音,来源于LibriVox项目的有声读物。数据集分为'clean'和'other'两个配置,支持自动语音识别和说话者识别任务,并提供音频文件、转录文本及说话者和章节信息。
以上内容由遇见数据集搜集并总结生成



