Arbi-Houssem/Tunisian_dataset_STT-TTS15s_filtred1.0_Mixed

Name: Arbi-Houssem/Tunisian_dataset_STT-TTS15s_filtred1.0_Mixed
Creator: Arbi-Houssem
Published: 2024-06-15 08:13:28
License: 暂无描述

Hugging Face2024-06-15 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/Arbi-Houssem/Tunisian_dataset_STT-TTS15s_filtred1.0_Mixed

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含音频和文本信息，具体特征包括音频文件、句子、开始时间、结束时间和说话者ID。数据集分为训练集和验证集，训练集包含882个样本，验证集包含221个样本。数据集的下载大小为155005627字节，总大小为155607773.0字节。

The dataset contains audio and text information, with specific features including audio files, sentences, start times, end times, and speaker IDs. The dataset is divided into a training set and a validation set, with 882 and 221 samples respectively. The download size of the dataset is 155005627 bytes, and the total size is 155607773.0 bytes.

提供机构：

Arbi-Houssem

原始信息汇总

数据集概述

数据特征

audio: 音频数据，数据类型为 audio。
sentence: 句子文本，数据类型为 string。
start_time: 开始时间，数据类型为 string。
end_time: 结束时间，数据类型为 string。
speaker: 说话者标识，数据类型为 int64。

数据集划分

train: 训练集，包含 882 个样本，占用 124429787.65911151 字节。
validation: 验证集，包含 221 个样本，占用 31177985.340888485 字节。

数据集大小

下载大小: 155005627 字节。
数据集总大小: 155607773.0 字节。

配置信息

config_name: default
- data_files:
  - train: 路径为 data/train-*。
  - validation: 路径为 data/validation-*。

5,000+

优质数据集

54 个

任务类型

进入经典数据集