five

isan-phonetic-dictionary

收藏
魔搭社区2025-12-05 更新2025-12-06 收录
下载链接:
https://modelscope.cn/datasets/scb10x/isan-phonetic-dictionary
下载链接
链接失效反馈
官方服务:
资源简介:
# Isan Phonetic Dictionary Dataset ## Dataset Description - **Homepage:** [opentyphoon.ai] - **Point of Contact:** [contact@opentyphoon.ai] ### Summary This dataset is a phonetic dictionary focused on **Isan (Northeastern Thai)** pronunciations. It is structured to handle linguistic complexities such as: 1. **Phonetic Variations (เสียงแปร):** Words that have multiple valid pronunciations without changing the meaning. 2. **Homographs (คำพ้องรูป):** Words that are spelled the same but have different pronunciations and meanings depending on the context. The data is provided in **TSV (Tab-Separated Values)** format. ### Supported Tasks - **Grapheme-to-Phoneme (G2P):** Converting Thai script to phonetic transcriptions (IPA). - **Dialect Analysis:** Studying phonological differences between Standard Thai and Isan. - **Speech Synthesis (TTS):** Providing accurate pronunciation data for Isan dialect synthesis. ## Dataset Structure ### Data Instances A typical instance in the dataset represents a word, its primary transcription, potential variations, and context if applicable. | word | phonetic_transcription | variation | homograph_context | | :--- | :--- | :--- | :--- | | รัก | h a k ˦ | l a k ˦ | | | ย่าง | j aː ŋ ˧˩ | | วิธีทำอาหารแบบหนึ่ง เช่น ไก่ย่าง | | ย่าง | ɲ aː ŋ ˦ | | ย่างเดิน |

# 伊桑语语音词典数据集 ## 数据集说明 - **主页:** [opentyphoon.ai] - **联系方式:** [contact@opentyphoon.ai] ### 概述 本数据集为聚焦于**伊桑语(Isan,泰国东北部方言)**语音的语音词典,其架构设计可应对如下语言复杂性场景: 1. **语音变体(Phonetic Variations, เสียงแปร)**:含义不变但存在多种合规发音的词汇。 2. **同形异音异义词(Homographs, คำพ้องรูป)**:拼写一致但根据语境存在不同发音与含义的词汇。 数据集以**TSV(制表符分隔值,Tab-Separated Values)**格式提供。 ### 支持任务 - **字素转音素(Grapheme-to-Phoneme, G2P)**:将泰文文本转换为国际音标(IPA)形式的语音转写。 - **方言分析(Dialect Analysis)**:研究标准泰语与伊桑语之间的音系差异。 - **语音合成(Speech Synthesis, TTS)**:为伊桑方言语音合成提供精准的发音数据。 ## 数据集结构 ### 数据条目 数据集中的典型条目包含一个词汇、其标准语音转写、可能存在的发音变体及适用语境。 | 词汇 | 语音转写 | 发音变体 | 同形异义词语境 | | :--- | :--- | :--- | :--- | | รัก | h a k ˦ | l a k ˦ | 无 | | ย่าง | j aː ŋ ˧˩ | 无 | 一种烹饪方式,例如烤鸡 | | ย่าง | ɲ aː ŋ ˦ | 无 | 缓步慢行 |
提供机构:
maas
创建时间:
2025-11-27
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作