VINH123/tiengviet
收藏数据集概述
基本信息
- 数据集名称: VIVOS
- 语言: 越南语
- 许可: CC BY-NC-SA 4.0
- 数据集大小: 10K<n<100K
- 多语言性: 单语种
- 任务类别: 自动语音识别
数据集结构
数据实例
一个典型的数据点包含音频文件的路径(path)和其转录文本(sentence),以及说话者的ID(speaker_id)。
数据字段
- speaker_id: 说话者的ID
- path: 音频文件的路径
- audio: 包含音频文件路径、解码后的音频数组和采样率的字典
- sentence: 用户被提示说的句子
数据分割
数据集分为训练集和测试集:
- 训练集:
- 说话者数量: 46
- 话语数量: 11660
- 持续时间: 14:55
- 独特音节: 4617
- 测试集:
- 说话者数量: 19
- 话语数量: 760
- 持续时间: 00:45
- 独特音节: 1692
数据集创建
数据来源
数据集由AILAB(VNUHCM - University of Science的一个计算机科学实验室)准备。
许可信息
数据集遵循CC BY-NC-SA 4.0许可。
引用信息
@inproceedings{luong-vu-2016-non, title = "A non-expert {K}aldi recipe for {V}ietnamese Speech Recognition System", author = "Luong, Hieu-Thi and Vu, Hai-Quan", booktitle = "Proceedings of the Third International Workshop on Worldwide Language Service Infrastructure and Second Workshop on Open Infrastructures and Analysis Frameworks for Human Language Technologies ({WLSI}/{OIAF}4{HLT}2016)", month = dec, year = "2016", address = "Osaka, Japan", publisher = "The COLING 2016 Organizing Committee", url = "https://aclanthology.org/W16-5207", pages = "51--55", }




