thaimos-tts-annotation
收藏魔搭社区2025-12-05 更新2025-06-21 收录
下载链接:
https://modelscope.cn/datasets/scb10x/thaimos-tts-annotation
下载链接
链接失效反馈官方服务:
资源简介:
# ThaiMOS (TTS MOS Evaluaution)
- (Older) TTS synthesized speech with human evaluation
- Mean Opinion Score (MOS)
- Annotation was done by Datawow
- Annonation aspect: sound quality, pronunciation, silence
- This dataset was originally developed in 2024 based on older TTS models -- likely that patterns in this data may not be applicable to modern TTS systems.
## Annotation Guideline
In directory pack, there are 12 directories each with 50 utterances.
Each subject carefully listens to an utterance and give the scores in three aspects as follows.
1. Sound_quality (Noise level): คุณภาพของไฟล์เสียงว่ามีเสียงรบกวนหรือเสียง noise ต่างๆมากน้อยขนาดไหน
2. Silence: การเว้นจังหวะหายใจระหว่างประโยคและระหว่่างคำ
3. Pronunciation: การออกเสียงในแต่ละคำว่าออกเสียงได้ถูกต้องในระดับไหน
All aspects are assessed from 1 to 5 (The higher, the better).
- Number of human subjects used for listening each utterance: 5-8 subjects
- Evaluation Conditions
1. The subjects have to be born and raised in Bangkok.
2. The subjects have to be in quiet place to evaluate the speech audio files.
# ThaiMOS(文本到语音合成平均意见得分评测,TTS MOS Evaluation)
- (旧版)文本到语音合成(Text-to-Speech,TTS)合成语音及人工评测结果
- 平均意见得分(Mean Opinion Score,MOS)
- 标注工作由Datawow公司完成
- 评测维度:音质、发音准确性、静音处理效果
- 该数据集于2024年首次构建,基于旧版TTS模型开发——因此其数据规律或不适用于当前主流的TTS系统。
## 标注指南
在数据包目录中,共包含12个子目录,每个子目录包含50条语音片段。
每位评测受试者需仔细聆听每条语音片段,并从以下三个维度进行评分:
1. **音质(噪声水平)**:评估音频文件受各类噪声干扰的程度
2. **静音处理**:评估语句间、词语间的呼吸停顿设置合理性
3. **发音准确性**:评估每个单词的发音正确程度
所有评测维度的评分范围均为1至5分,分数越高代表表现越好。
- 每条语音片段的评测受试者数量为5至8人
- 评测要求:
1. 评测受试者需在曼谷出生并长大
2. 评测受试者需在安静环境中完成语音音频评测。
提供机构:
maas
创建时间:
2025-06-14



