cmu-mlsp/librispeech960-encodec1024_asr
收藏Hugging Face2023-12-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cmu-mlsp/librispeech960-encodec1024_asr
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validation
path: data/validation-*
- split: test
path: data/test-*
- split: validation_other
path: data/validation_other-*
- split: test_other
path: data/test_other-*
dataset_info:
features:
- name: text
dtype: string
- name: audio_codes
sequence: string
- name: id
dtype: string
- name: speaker_id
dtype: int64
- name: chapter_id
dtype: int64
splits:
- name: train
num_bytes: 1859401929
num_examples: 281241
- name: validation
num_bytes: 10515210
num_examples: 2703
- name: test
num_bytes: 10516648
num_examples: 2620
- name: validation_other
num_bytes: 9974741
num_examples: 2864
- name: test_other
num_bytes: 10389123
num_examples: 2939
download_size: 0
dataset_size: 1900797651
---
# Dataset Card for "librispeech960-encodec1024_asr"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
cmu-mlsp
原始信息汇总
数据集概述
数据集名称
librispeech960-encodec1024_asr
数据配置
- 默认配置
- 训练集(train):路径为
data/train-* - 验证集(validation):路径为
data/validation-* - 测试集(test):路径为
data/test-* - 其他验证集(validation_other):路径为
data/validation_other-* - 其他测试集(test_other):路径为
data/test_other-*
- 训练集(train):路径为
数据特征
- 文本(text):字符串类型
- 音频编码(audio_codes):字符串序列
- 标识符(id):字符串类型
- 说话者标识符(speaker_id):64位整数类型
- 章节标识符(chapter_id):64位整数类型
数据分割
- 训练集(train)
- 字节数:1859401929
- 样本数:281241
- 验证集(validation)
- 字节数:10515210
- 样本数:2703
- 测试集(test)
- 字节数:10516648
- 样本数:2620
- 其他验证集(validation_other)
- 字节数:9974741
- 样本数:2864
- 其他测试集(test_other)
- 字节数:10389123
- 样本数:2939
数据集大小
- 下载大小:0
- 数据集大小:1900797651



