five

TruongScotl/stvi

收藏
Hugging Face2024-01-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/TruongScotl/stvi
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个语音到文本翻译的数据集,源音频为英语,目标句子为越南语。数据集来源于PhoST,音频被分割为1-15秒的片段,每个片段对应一个句子,并进行了拼写校正、词汇标准化和音频分割处理。数据集包含训练集和测试集,分别有294723和1095个样本。

该数据集是一个语音到文本翻译的数据集,源音频为英语,目标句子为越南语。数据集来源于PhoST,音频被分割为1-15秒的片段,每个片段对应一个句子,并进行了拼写校正、词汇标准化和音频分割处理。数据集包含训练集和测试集,分别有294723和1095个样本。
提供机构:
TruongScotl
原始信息汇总

数据集概述

这是一个语音到文本翻译数据集,源音频为英语,目标句子为越南语。数据集中的音频被分割成1-15秒的片段,每个片段对应一个句子,并进行了拼写校正、标准化和音频分割处理。

数据结构

数据集包含以下字段:

  • path: 音频文件的路径
  • audio: 一个字典,包含下载的音频文件路径、解码后的音频数组和采样率
  • sentence: 转录的句子

数据分割

语音材料被细分为训练集和测试集。语音来自TED演讲,每个语音片段对应一个转录的句子。

训练集 测试集
语音片段数 294723 1054
时长(小时) 425.91 1.616
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作