five

数据堂— 292小时泰语手机语音采集数据

收藏
魔搭社区2025-11-26 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/DatatangBeijing/292Hours_ThaiSpeechDataByMobilePhone
下载链接
链接失效反馈
官方服务:
资源简介:
292小时泰语语音手机采集数据,由498位泰国本地人员参与采集。录音环境安静,录音内容包括经济、娱乐、新闻、口语、数字等多个领域。每人约400句,有效数据时长292小时,泰语语音手机采集数据所有文本由人工转写,准确率高

This is a 292-hour Thai speech dataset collected via mobile devices. A total of 498 local Thai participants joined the data collection. The recordings were made in quiet environments, and the content covers multiple domains such as economy, entertainment, news, daily spoken language, digital-related topics, etc. Each participant provided approximately 400 utterances. The total effective duration of the dataset is 292 hours. All transcriptions of the Thai speech data are manually conducted with high accuracy.
提供机构:
maas
创建时间:
2024-05-06
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个包含292小时泰语手机语音的集合,由498名母语者录制,内容覆盖多个领域,适用于语音识别模型测试。数据经过高质量的人工转录,准确率高,格式规范,适合商业用途。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务