five

MonlamAI/tibetan-voice-benchmark

收藏
Hugging Face2025-04-07 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/MonlamAI/tibetan-voice-benchmark
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个藏语语音转文本的基准数据集,包含有声书、儿童语音、历史、藏语电影、自然语言、新闻、播客和藏语教学等类型的语音数据。所有的转录文本都经过了至少一个人的审核,确保了文本的准确性。数据集的转录质量分为三个等级,分别代表不同的审核程度。

This is a benchmark Tibetan Speech-to-Text dataset, including audio books, childrens speech, history, Tibetan movies, natural speech, news, podcasts, and Tibetan teachings. All the transcripts have been reviewed by at least one person in addition to the original transcriber to ensure accuracy. The transcription quality of the dataset is divided into three levels, representing different degrees of review.
提供机构:
MonlamAI
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个藏语语音识别基准数据集,包含8,367条经过审核的藏语语音转录数据,涵盖多种语音类型,如儿童语音、电影、新闻等,适用于语音识别模型的训练和评估。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作