TruongScotl/stvi
收藏Hugging Face2024-01-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/TruongScotl/stvi
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个语音到文本翻译的数据集,源音频为英语,目标句子为越南语。数据集来源于PhoST,音频被分割为1-15秒的片段,每个片段对应一个句子,并进行了拼写校正、词汇标准化和音频分割处理。数据集包含训练集和测试集,分别有294723和1095个样本。
该数据集是一个语音到文本翻译的数据集,源音频为英语,目标句子为越南语。数据集来源于PhoST,音频被分割为1-15秒的片段,每个片段对应一个句子,并进行了拼写校正、词汇标准化和音频分割处理。数据集包含训练集和测试集,分别有294723和1095个样本。
提供机构:
TruongScotl
原始信息汇总
数据集概述
这是一个语音到文本翻译数据集,源音频为英语,目标句子为越南语。数据集中的音频被分割成1-15秒的片段,每个片段对应一个句子,并进行了拼写校正、标准化和音频分割处理。
数据结构
数据集包含以下字段:
path: 音频文件的路径audio: 一个字典,包含下载的音频文件路径、解码后的音频数组和采样率sentence: 转录的句子
数据分割
语音材料被细分为训练集和测试集。语音来自TED演讲,每个语音片段对应一个转录的句子。
| 训练集 | 测试集 | |
|---|---|---|
| 语音片段数 | 294723 | 1054 |
| 时长(小时) | 425.91 | 1.616 |



