five

数据堂—490人泰语手机采集语音数据

收藏
魔搭社区2025-11-26 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/DatatangBeijing/490People-ThaiSpeechDataByMobilePhone
下载链接
链接失效反馈
官方服务:
资源简介:
泰语手机采集语音数据_引导是由490位泰国本地人员参与采集。录音环境安静,录音内容包括车载、家居、语音助手等多个领域。每人约50句,有效数据时长15小时,所有文本由人工转写,准确率高

This guided Thai speech dataset collected via mobile phones involves 490 local Thai participants. The recordings are conducted in quiet environments, covering multiple domains including in-car scenarios, home settings, and voice assistant interactions. Each participant provided approximately 50 utterances, resulting in a total valid data duration of 15 hours. All transcriptions are manually performed with high accuracy.
提供机构:
maas
创建时间:
2024-05-06
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集由490名泰语母语者使用手机采集,总有效时长为15小时,每人录制约50句语音,用于泰语语音识别模型的测试任务。录音在安静室内环境中进行,数据格式为16kHz、16bit的未压缩WAV单声道文件,包含高准确度的文本转录和相关标注。数据集版权归DataTang所有,支持商业用途。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务