mekaneeky/Speech_raw_synth_n_solomon_11_7
收藏Hugging Face2023-07-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mekaneeky/Speech_raw_synth_n_solomon_11_7
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: audio
sequence:
sequence: float32
- name: sample_rate
dtype: int64
- name: transcription
dtype: string
- name: speaker_id
dtype: string
- name: ach
dtype: string
- name: lgg
dtype: string
- name: eng
dtype: string
- name: nyn
dtype: string
- name: teo
dtype: string
splits:
- name: train
num_bytes: 10951104456
num_examples: 32352
- name: validation
num_bytes: 140755764
num_examples: 407
download_size: 9629565036
dataset_size: 11091860220
---
# Dataset Card for "Speech_raw_synth_n_solomon_11_7"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
mekaneeky
原始信息汇总
数据集概述
数据集信息
特征
- audio: 音频数据,类型为
float32序列。 - sample_rate: 采样率,类型为
int64。 - transcription: 转录文本,类型为
string。 - speaker_id: 说话者标识,类型为
string。 - ach: 未知特征,类型为
string。 - lgg: 未知特征,类型为
string。 - eng: 未知特征,类型为
string。 - nyn: 未知特征,类型为
string。 - teo: 未知特征,类型为
string。
数据分割
- train: 训练集,包含 32352 个样本,总字节数为 10951104456。
- validation: 验证集,包含 407 个样本,总字节数为 140755764。
数据大小
- 下载大小: 9629565036 字节。
- 数据集大小: 11091860220 字节。



