five

Splend1dchan/librispeech_asr_individual

收藏
Hugging Face2023-06-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Splend1dchan/librispeech_asr_individual
下载链接
链接失效反馈
官方服务:
资源简介:
LibriSpeech是一个包含约1000小时16kHz英语朗读语音的语料库,数据来源于LibriVox项目的有声读物,并经过精心分段和对齐。该数据集支持自动语音识别(ASR)和音频说话人识别任务,包含两个配置:clean和other。clean配置的语音质量较高,口音更接近美式英语,而other配置的语音质量相对较低。数据集的结构包括音频文件路径、音频数据、文本转录、说话人ID、章节ID和唯一ID等信息。数据集分为训练集、验证集和测试集,训练集进一步分为train.100、train.360和train.500。

LibriSpeech是一个包含约1000小时16kHz英语朗读语音的语料库,数据来源于LibriVox项目的有声读物,并经过精心分段和对齐。该数据集支持自动语音识别(ASR)和音频说话人识别任务,包含两个配置:clean和other。clean配置的语音质量较高,口音更接近美式英语,而other配置的语音质量相对较低。数据集的结构包括音频文件路径、音频数据、文本转录、说话人ID、章节ID和唯一ID等信息。数据集分为训练集、验证集和测试集,训练集进一步分为train.100、train.360和train.500。
提供机构:
Splend1dchan
原始信息汇总

数据集概述

名称: LibriSpeech

语言: 英语(en)

许可证: CC-BY-4.0

多语言性: 单语种(monolingual)

任务类别:

  • 自动语音识别(automatic-speech-recognition)
  • 音频分类(audio-classification)

任务ID: 说话人识别(speaker-identification)

数据集大小: 100K<n<1M

源数据: 原始数据(original)

数据集结构

特征

  • file: 字符串类型,音频文件路径。
  • audio: 音频类型,采样率为16000 Hz。
  • text: 字符串类型,音频转录文本。
  • speaker_id: 整数类型,说话人唯一标识。
  • chapter_id: 整数类型,有声书章节唯一标识。
  • id: 字符串类型,数据样本唯一标识。

数据分割

  • clean配置:

    • train.100: 28539个样本,6619683041字节。
    • train.360: 104014个样本,23898214592字节。
    • validation: 2703个样本,359572231字节。
    • test: 2620个样本,367705423字节。
    • 下载大小: 30121377654字节。
    • 数据集大小: 31245175287字节。
  • other配置:

    • train.500: 148688个样本,31810256902字节。
    • validation: 2864个样本,337283304字节。
    • test: 2939个样本,352396474字节。
    • 下载大小: 31236565377字节。
    • 数据集大小: 32499936680字节。
  • all配置:

    • 下载大小: 61357943031字节。
    • 数据集大小: 63826462287字节。

数据集创建

注释创建者: 专家生成(expert-generated)

语言创建者:

  • 众包(crowdsourced)
  • 专家生成(expert-generated)
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
librispeech_asr_individual是一个大型英语语音识别数据集,包含约1000小时的16kHz朗读语音,来源于LibriVox项目的有声读物。数据集分为'clean'和'other'两个配置,支持自动语音识别和说话者识别任务,并提供音频文件、转录文本及说话者和章节信息。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作