cmu-mlsp/encodec_24khz-opt-125m-pretrained-ft-librispeech_asr-train.clean.100-features

Name: cmu-mlsp/encodec_24khz-opt-125m-pretrained-ft-librispeech_asr-train.clean.100-features
Creator: cmu-mlsp
Published: 2023-10-20 08:57:41
License: 暂无描述

Hugging Face2023-10-20 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/cmu-mlsp/encodec_24khz-opt-125m-pretrained-ft-librispeech_asr-train.clean.100-features

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含多种特征，包括文件名、音频（采样率24000Hz）、文本、说话人ID、章节ID和唯一ID。数据集主要分为train.clean.100部分，包含28539个样本，总数据大小为17829358087.0字节，下载大小为17071868433字节。

提供机构：

cmu-mlsp

原始信息汇总

数据集概述

数据集信息

特征列表：
- file：文件名，数据类型为字符串。
- audio：音频数据，采样率为24000。
- text：文本数据，数据类型为字符串。
- speaker_id：说话者ID，数据类型为整数（int64）。
- chapter_id：章节ID，数据类型为整数（int64）。
- id：标识符，数据类型为字符串。
- audio_codes：音频编码，数据类型为整数序列（int64）。
数据分割：
- train.clean.100：训练集，包含28539个样本，总字节数为17829358087.0。
数据集大小：
- 下载大小：17071868433字节
- 数据集大小：17829358087.0字节

配置信息

默认配置：
- 数据文件路径：data/train.clean.100-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集