five

zionia/isizulu-asr-1.1

收藏
Hugging Face2025-11-10 更新2025-11-15 收录
下载链接:
https://hf-mirror.com/datasets/zionia/isizulu-asr-1.1
下载链接
链接失效反馈
官方服务:
资源简介:
isiZulu语音识别增强数据集是一个包含isiZulu语言的语音录音和转录的数据集,针对OpenAI的Whisper自动语音识别模型进行了优化。数据集包含672个样本,语音格式为16kHz单声道WAV,最长30秒。转录文本经过清理,包括小写转换、去除标点和词性标记等处理。

The isiZulu Speech Recognition Augmented Dataset is a collection of speech recordings and transcriptions in isiZulu, optimized for OpenAIs Whisper ASR models. The dataset includes 672 samples, with audio in WAV format at 16kHz mono, up to a maximum duration of 30 seconds. The transcriptions have been cleaned, including conversion to lowercase, removal of punctuation, and POS markers.
提供机构:
zionia
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作