isan-phonetic-dictionary
收藏魔搭社区2025-12-05 更新2025-12-06 收录
下载链接:
https://modelscope.cn/datasets/scb10x/isan-phonetic-dictionary
下载链接
链接失效反馈官方服务:
资源简介:
# Isan Phonetic Dictionary Dataset
## Dataset Description
- **Homepage:** [opentyphoon.ai]
- **Point of Contact:** [contact@opentyphoon.ai]
### Summary
This dataset is a phonetic dictionary focused on **Isan (Northeastern Thai)** pronunciations. It is structured to handle linguistic complexities such as:
1. **Phonetic Variations (เสียงแปร):** Words that have multiple valid pronunciations without changing the meaning.
2. **Homographs (คำพ้องรูป):** Words that are spelled the same but have different pronunciations and meanings depending on the context.
The data is provided in **TSV (Tab-Separated Values)** format.
### Supported Tasks
- **Grapheme-to-Phoneme (G2P):** Converting Thai script to phonetic transcriptions (IPA).
- **Dialect Analysis:** Studying phonological differences between Standard Thai and Isan.
- **Speech Synthesis (TTS):** Providing accurate pronunciation data for Isan dialect synthesis.
## Dataset Structure
### Data Instances
A typical instance in the dataset represents a word, its primary transcription, potential variations, and context if applicable.
| word | phonetic_transcription | variation | homograph_context |
| :--- | :--- | :--- | :--- |
| รัก | h a k ˦ | l a k ˦ | |
| ย่าง | j aː ŋ ˧˩ | | วิธีทำอาหารแบบหนึ่ง เช่น ไก่ย่าง |
| ย่าง | ɲ aː ŋ ˦ | | ย่างเดิน |
# 伊桑语语音词典数据集
## 数据集说明
- **主页:** [opentyphoon.ai]
- **联系方式:** [contact@opentyphoon.ai]
### 概述
本数据集为聚焦于**伊桑语(Isan,泰国东北部方言)**语音的语音词典,其架构设计可应对如下语言复杂性场景:
1. **语音变体(Phonetic Variations, เสียงแปร)**:含义不变但存在多种合规发音的词汇。
2. **同形异音异义词(Homographs, คำพ้องรูป)**:拼写一致但根据语境存在不同发音与含义的词汇。
数据集以**TSV(制表符分隔值,Tab-Separated Values)**格式提供。
### 支持任务
- **字素转音素(Grapheme-to-Phoneme, G2P)**:将泰文文本转换为国际音标(IPA)形式的语音转写。
- **方言分析(Dialect Analysis)**:研究标准泰语与伊桑语之间的音系差异。
- **语音合成(Speech Synthesis, TTS)**:为伊桑方言语音合成提供精准的发音数据。
## 数据集结构
### 数据条目
数据集中的典型条目包含一个词汇、其标准语音转写、可能存在的发音变体及适用语境。
| 词汇 | 语音转写 | 发音变体 | 同形异义词语境 |
| :--- | :--- | :--- | :--- |
| รัก | h a k ˦ | l a k ˦ | 无 |
| ย่าง | j aː ŋ ˧˩ | 无 | 一种烹饪方式,例如烤鸡 |
| ย่าง | ɲ aː ŋ ˦ | 无 | 缓步慢行 |
提供机构:
maas
创建时间:
2025-11-27



