Arbi-Houssem/Tunisian_dataset_STT-TTS15s_filtred_organiser
收藏Hugging Face2024-07-09 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Arbi-Houssem/Tunisian_dataset_STT-TTS15s_filtred_organiser
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频文件、对应的句子文本、音频的开始和结束时间以及说话者的ID。数据集分为训练集和验证集,训练集包含723个样本,验证集包含386个样本。数据集的下载大小为156305512字节,总大小为158262197.63762444字节。
This dataset includes audio files, corresponding sentence texts, start and end times of the audio, and speaker IDs. The dataset is divided into a training set and a validation set, with the training set containing 723 samples and the validation set containing 386 samples. The download size of the dataset is 156305512 bytes, and the total size is 158262197.63762444 bytes.
提供机构:
Arbi-Houssem
原始信息汇总
数据集概述
特征信息
- audio: 音频数据,数据类型为
audio。 - sentence: 句子文本,数据类型为
string。 - start_time: 开始时间,数据类型为
string。 - end_time: 结束时间,数据类型为
string。 - speaker_id: 说话者ID,数据类型为
string。
数据集划分
- train: 训练集,包含 723 个样本,占用 100201574.05364512 字节。
- validation: 验证集,包含 386 个样本,占用 58060623.58397933 字节。
数据集大小
- 下载大小: 156305512 字节
- 数据集总大小: 158262197.63762444 字节
配置信息
- config_name: default
- data_files:
- train: 路径为
data/train-* - validation: 路径为
data/validation-*
- train: 路径为
- data_files:



