five

k2-fsa/LibriSpeech

收藏
Hugging Face2024-02-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/k2-fsa/LibriSpeech
下载链接
链接失效反馈
官方服务:
资源简介:
LibriSpeech是一个包含约1000小时16kHz英语朗读语音的语料库,由Vassil Panayotov在Daniel Povey的协助下准备。数据来源于LibriVox项目的朗读有声读物,并经过仔细的分段和对齐。基于该数据集训练的声学模型和语言模型也可在相关资源中找到。

LibriSpeech是一个包含约1000小时16kHz英语朗读语音的语料库,由Vassil Panayotov在Daniel Povey的协助下准备。数据来源于LibriVox项目的朗读有声读物,并经过仔细的分段和对齐。基于该数据集训练的声学模型和语言模型也可在相关资源中找到。
提供机构:
k2-fsa
原始信息汇总

LibriSpeech 数据集概述

数据集描述

LibriSpeech 是一个包含约 1000 小时 16kHz 采样率的英语朗读语音的语料库,由 Vassil Panayotov 在 Daniel Povey 的协助下准备。数据来源于 LibriVox 项目的朗读有声书,并经过精心分割和校准。

相关资源

  • 基于此数据集训练的声学模型可在 icefall 获取。
  • 适用于评估的语言模型可在 openslr 找到。

参考文献

  • "LibriSpeech: an ASR corpus based on public domain audio books",Vassil Panayotov, Guoguo Chen, Daniel Povey 和 Sanjeev Khudanpur,ICASSP 2015 pdf
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作