seanghay/khmer_mpwt_speech
收藏Hugging Face2023-06-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/seanghay/khmer_mpwt_speech
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频和转录文本,主要用于文本到语音的研究。数据集来源于柬埔寨公共工程和交通部的一个移动应用,经过人工审查,但可能仍存在错误。数据集包含2058个训练样本,总时长为6957.366113秒(约1.932小时)。
该数据集包含音频和转录文本,主要用于文本到语音的研究。数据集来源于柬埔寨公共工程和交通部的一个移动应用,经过人工审查,但可能仍存在错误。数据集包含2058个训练样本,总时长为6957.366113秒(约1.932小时)。
提供机构:
seanghay
原始信息汇总
数据集概述
数据集特征
- audio: 音频数据类型
- transcription: 字符串数据类型
- raw_transcription: 字符串数据类型
数据集分割
- train:
- 数据量: 28186841.51 字节
- 示例数量: 2058
数据集大小
- 下载大小: 27267047 字节
- 数据集大小: 28186841.51 字节
任务类别
- text-to-speech
语言
- km (高棉语)
数据集名称
- Khmer MPWT Speech
大小类别
- 1K<n<10K



