Arbi-Houssem/Tunisian_dataset_STT-TTS15s_filtred_organiser

Name: Arbi-Houssem/Tunisian_dataset_STT-TTS15s_filtred_organiser
Creator: Arbi-Houssem
Published: 2024-07-09 16:55:25
License: 暂无描述

Hugging Face2024-07-09 更新2024-07-22 收录

下载链接：

https://hf-mirror.com/datasets/Arbi-Houssem/Tunisian_dataset_STT-TTS15s_filtred_organiser

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含音频文件、对应的句子文本、音频的开始和结束时间以及说话者的ID。数据集分为训练集和验证集，训练集包含723个样本，验证集包含386个样本。数据集的下载大小为156305512字节，总大小为158262197.63762444字节。

This dataset includes audio files, corresponding sentence texts, start and end times of the audio, and speaker IDs. The dataset is divided into a training set and a validation set, with the training set containing 723 samples and the validation set containing 386 samples. The download size of the dataset is 156305512 bytes, and the total size is 158262197.63762444 bytes.

提供机构：

Arbi-Houssem

原始信息汇总

数据集概述

特征信息

audio: 音频数据，数据类型为 audio。
sentence: 句子文本，数据类型为 string。
start_time: 开始时间，数据类型为 string。
end_time: 结束时间，数据类型为 string。
speaker_id: 说话者ID，数据类型为 string。

数据集划分

train: 训练集，包含 723 个样本，占用 100201574.05364512 字节。
validation: 验证集，包含 386 个样本，占用 58060623.58397933 字节。

数据集大小

下载大小: 156305512 字节
数据集总大小: 158262197.63762444 字节

配置信息

config_name: default
- data_files:
  - train: 路径为 data/train-*
  - validation: 路径为 data/validation-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集