STRUCT_AMB_IND
收藏数据集概述
数据集名称
- STRUCT_AMB_IND
数据集内容
- 包含印尼语中结构/句法歧义句子的首个语音数据集。
- 每个歧义句子有两个不同的解释文本。
数据集构成
-
ind_speech- 包含22位发言者的录音结果,其中2位为专业发言者,20位为本科生。
- 共有4800个.wav文件,按发言者分组。
- 文件命名格式:
ID_(M/F)XX_TypeYY_ZZZZV.wav
-
text- 包含两个文件:
ID_amb_disam_text.txt:包含400个歧义句子的800行文本,每个句子有两个解释。ID_amb_disam_transcript.txt:包含4800行文本,对应每个录音文件。
- 包含两个文件:
-
keys- 包含三个子目录:
spk_keys:包含每个发言者的<AMB_SENT_CODE>键。train_dev_test_text_keys:包含400对歧义文本及其解释的训练、开发和测试键。train_dev_test_spk_keys:包含4800对歧义语音转录及其解释的训练、开发和测试键。
- 包含三个子目录:
-
other- 包含用于ASR和SD额外训练数据的键,来自
Indonesian LVCSR news corpus。
- 包含用于ASR和SD额外训练数据的键,来自
研究论文
-
论文标题:Speech Recognition and Meaning Interpretation: Towards Disambiguation of Structurally Ambiguous Spoken Utterances in Indonesian
-
发表于EMNLP 2023。
-
引用信息:
@inproceedings{widiaputri-etal-2023-speech, title = "Speech Recognition and Meaning Interpretation: Towards Disambiguation of Structurally Ambiguous Spoken Utterances in {I}ndonesian", author = "Widiaputri, Ruhiyah and Purwarianti, Ayu and Lestari, Dessi and Azizah, Kurniawati and Tanaya, Dipta and Sakti, Sakriani", booktitle = "Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing", month = dec, year = "2023", address = "Singapore", publisher = "Association for Computational Linguistics", url = "https://aclanthology.org/2023.emnlp-main.1045", doi = "10.18653/v1/2023.emnlp-main.1045", }




