TruongScotl/stvi

Name: TruongScotl/stvi
Creator: TruongScotl
Published: 2024-01-09 07:27:46
License: 暂无描述

Hugging Face2024-01-09 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/TruongScotl/stvi

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个语音到文本翻译的数据集，源音频为英语，目标句子为越南语。数据集来源于PhoST，音频被分割为1-15秒的片段，每个片段对应一个句子，并进行了拼写校正、词汇标准化和音频分割处理。数据集包含训练集和测试集，分别有294723和1095个样本。

提供机构：

TruongScotl

原始信息汇总

数据集概述

这是一个语音到文本翻译数据集，源音频为英语，目标句子为越南语。数据集中的音频被分割成1-15秒的片段，每个片段对应一个句子，并进行了拼写校正、标准化和音频分割处理。

数据集包含以下字段：

语音材料被细分为训练集和测试集。语音来自TED演讲，每个语音片段对应一个转录的句子。

	训练集	测试集
语音片段数	294723	1054
时长（小时）	425.91	1.616

5,000+

优质数据集

54 个

任务类型

进入经典数据集