somehowchris/librispeech_asr_test
收藏Hugging Face2024-04-14 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/somehowchris/librispeech_asr_test
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: file
dtype: string
- name: audio
dtype:
audio:
sampling_rate: 16000
- name: text
dtype: string
- name: speaker_id
dtype: int64
- name: chapter_id
dtype: int64
- name: id
dtype: string
- name: speaker_embedding
sequence:
sequence:
sequence: float32
- name: text_semantic_ids
sequence:
sequence:
sequence: int64
- name: codec_codes
sequence:
sequence:
sequence: int64
splits:
- name: test.clean
num_bytes: 756378174.5
num_examples: 2620
download_size: 671112092
dataset_size: 756378174.5
configs:
- config_name: default
data_files:
- split: test.clean
path: data/test.clean-*
---
提供机构:
somehowchris
原始信息汇总
数据集概述
数据集特征
- file: 数据类型为字符串。
- audio: 数据类型为音频,采样率为16000。
- text: 数据类型为字符串。
- speaker_id: 数据类型为64位整数。
- chapter_id: 数据类型为64位整数。
- id: 数据类型为字符串。
- speaker_embedding: 数据类型为32位浮点数序列。
- text_semantic_ids: 数据类型为64位整数序列。
- codec_codes: 数据类型为64位整数序列。
数据集分割
- test.clean: 包含2620个样本,数据大小为756378174.5字节。
数据集大小
- 下载大小: 671112092字节
- 数据集大小: 756378174.5字节
配置
- config_name: default
- data_files:
- split: test.clean
- path: data/test.clean-*



