malaysia-ai/clean-podcast
收藏Hugging Face2023-03-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/malaysia-ai/clean-podcast
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为Clean podcast audio,使用了语音活动检测(VAD)技术进行分割,确保至少30%的语音是经过清理的。数据集的总时长约为352小时。
该数据集名为Clean podcast audio,使用了语音活动检测(VAD)技术进行分割,确保至少30%的语音是经过清理的。数据集的总时长约为352小时。
提供机构:
malaysia-ai
原始信息汇总
数据集概述
数据集名称
Clean podcast audio
数据处理方法
- 使用语音活动检测(VAD)进行分割
- 检测至少30%的清洁语音
数据量
- 约352小时
数据集位置
https://github.com/huseinzol05/malaya-speech/tree/master/data/podcast



