cmu-mlsp/encodec_24khz-opt-125m-pretrained-ft-librispeech_asr-train.clean.100-features
收藏Hugging Face2023-10-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cmu-mlsp/encodec_24khz-opt-125m-pretrained-ft-librispeech_asr-train.clean.100-features
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多种特征,包括文件名、音频(采样率24000Hz)、文本、说话人ID、章节ID和唯一ID。数据集主要分为train.clean.100部分,包含28539个样本,总数据大小为17829358087.0字节,下载大小为17071868433字节。
该数据集包含多种特征,包括文件名、音频(采样率24000Hz)、文本、说话人ID、章节ID和唯一ID。数据集主要分为train.clean.100部分,包含28539个样本,总数据大小为17829358087.0字节,下载大小为17071868433字节。
提供机构:
cmu-mlsp
原始信息汇总
数据集概述
数据集信息
-
特征列表:
file:文件名,数据类型为字符串。audio:音频数据,采样率为24000。text:文本数据,数据类型为字符串。speaker_id:说话者ID,数据类型为整数(int64)。chapter_id:章节ID,数据类型为整数(int64)。id:标识符,数据类型为字符串。audio_codes:音频编码,数据类型为整数序列(int64)。
-
数据分割:
train.clean.100:训练集,包含28539个样本,总字节数为17829358087.0。
-
数据集大小:
- 下载大小:17071868433字节
- 数据集大小:17829358087.0字节
配置信息
- 默认配置:
- 数据文件路径:
data/train.clean.100-*
- 数据文件路径:



