Gravações de cunho fonético-acústico e seus respectivos Texgrids, assim como tabela geral de dados gerada pelo programa Praat
收藏DataCite Commons2024-12-20 更新2025-04-17 收录
下载链接:
https://redu.unicamp.br/citation?persistentId=doi:10.25824/redu/YWYHMP
下载链接
链接失效反馈官方服务:
资源简介:
Uma amostra da população de Iguatu, localizada no estado do Ceará, foi coletada aleatoriamente para compor o corpus deste estudo de Fonética Experimental, que incluiu a participação de oito indivíduos, sendo quatro homens e quatro mulheres, todos na faixa etária de 39 a 59 anos. Dois homens e duas mulheres possuem o Fundamental II, assim como os outros dois homens e mulheres possuem o nível Superior completo. A amostra é constituída por 51 palavras paroxítonas terminadas em [ɪ] e 51 palavras paroxítonas terminadas em [ʊ], totalizando 102 palavras. Esses vocábulos foram selecionados com base em critérios de aleatoriedade e familiaridade (palavras de uso cotidiano), utilizando o site https://www.dicio.com.br/. Dentro de cada conjunto de palavras com vogais finais, foram separados subgrupos classificados como dissílabos, trissílabos e quadrissílabos, levando-se em consideração também o modo de articulação das consoantes que precedem essas vogais. A quantidade de sons consonantais que precedem as vogais em estudo, conforme seu modo de articulação, é a seguinte: seis nasais para [ɪ] e seis nasais para [ʊ]; nove oclusivas desvozeadas para [ɪ] e dez oclusivas desvozeadas para [ʊ]; nove oclusivas vozeadas para [ɪ] e oito oclusivas vozeadas para [ʊ]; nove fricativas desvozeadas para [ɪ] e nove fricativas desvozeadas para [ʊ]; nove fricativas vozeadas para [ɪ] e nove fricativas vozeadas para [ʊ]; seis róticos para [ɪ] e seis róticos para [ʊ]; três laterais para [ɪ] e três laterais para [ʊ].Os oito participantes realizaram as gravações em um estúdio acústico. Para a captação dos dados, foram utilizados os seguintes equipamentos: um microfone condensador C-1 Behringer, um fone de ouvido AKG K92, uma interface de áudio Behringer U-PHORIA UMC 404HD e um laptop DELL i5, 7ª geração, com 1 TB de armazenamento, para a exibição dos slides. As gravações foram feitas no formato WAV e a taxa de amostragem foi de 44.1 kHz. Todos os participantes foram submetidos a um protocolo de coleta de dados composto por 102 palavras-alvo, inseridas na frase-veículo "Digo _________ baixinho". A utilização de uma frase-veículo padrão em todas as gravações visa homogeneizar, ao máximo possível, o ambiente fonético em que as vogais altas finais ocorrem, permitindo, assim, fazer comparações com outros estudos que se serviram do mesmo protocolo. Os parâmetros medidos nesse ambiente controlado foram os valores de F1 das vogais tônicas e átonas finais, duração bruta da vogal final, duração relativa, F0 médio, desvio padrão de F0, que foram comparados com os mesmos valores obtidos em um contexto diferente. Para isso, foram utilizados dois pequenos textos narrativos contendo todos os vocábulos previamente mencionados nas tabelas, que foram lidos por todos os participantes. Essa abordagem busca uma maior naturalidade na fala, permitindo a comparação das medições acústicas entre as duas situações. Os 102 vocábulos foram inseridos na frase-veículo e apresentados em telas do PowerPoint no laptop do pesquisador, resultando em um total correspondente de slides. O pesquisador solicitou que cada um dos oito participantes repetisse, de forma aleatória, todas as frases-veículo três vezes. Inicialmente, uma rodada de gravação foi realizada para que os participantes se sentissem mais à vontade com a situação e se familiarizassem com as palavras e a dinâmica das gravações, evitando possíveis problemas de dicção e hesitações devido ao desconhecimento de algum vocábulo. Dessa forma, essa primeira gravação foi descartada. Ao final da terceira rodada de repetição de cada conjunto de palavras, ou seja, dos vocábulos terminados em 'e' e dos vocábulos terminados em 'o', cada participante realizou, apenas uma vez, a leitura dos dois textos narrativos (um para cada grupo de palavras) numa taxa de elocução que lhes fosse confortável e habitual. Esses textos foram apresentados pelo pesquisador através do laptop. Tanto as frases-veículo quanto os textos narrativos foram gravados para posterior análise. Após a realização das gravações, os dados foram processados em duas etapas: a análise acústica, realizada utilizando o programa PRAAT (Boersma Weenink, 2019), versão 6.1.03; e a análise estatística, conduzida com o uso do software RStudio, versão 2021.09.0. Cada vogal tônica e átona final foi segmentada e etiquetada em uma mesma camada de anotação do Praat, enquanto o vocábulo correspondente foi marcado em uma camada separada. A consoante precedente foi anotada em uma camada distinta, registrando o contexto precedente. Nos casos em que os vocábulos pertenciam ao texto narrativo, a última camada foi preenchida com uma consoante precedente e uma etiqueta identificando o contexto subsequente, que poderia ser uma consoante, uma vogal ou até mesmo silêncio. Com as segmentações de todos os áudios disponíveis, obtidas através dos TextGrids no Praat, foi utilizado o script GenAcousticsSegments desenvolvido por Barbosa (2024), que automatizou a geração dos valores de F1 (Hz) das vogais-alvo; a duração bruta das vogais átonas finais; os valores de F0 médio; desvio padrão de F0 e a ênfase espectral (cf. Traunmüller e Eriksson, 2000), além de registrar nomes dos arquivos de áudio, que informam sobre participante e vogal final e as etiquetas dos contextos. Informações sobre sexo e escolaridade foram preenchidas manualmente a partir do arquivo de saída, bem como a duração relativa das vogais-alvo (vogais átonas finais).
本实验语音学(Fonética Experimental)研究的语料库采用随机抽样方式,从巴西塞阿拉州伊瓜图市的居民中招募了8名受试者,其中男女各4名,年龄区间为39至59岁。其中2男2女的最高学历为巴西基础教育第二阶段(Fundamental II),剩余2男2女性均完成本科高等教育毕业(Superior completo)。
本次语料库共包含102个目标词,其中51个为以[ɪ]结尾的重音倒数第二音节词(paroxítonas),另外51个为以[ʊ]结尾的重音倒数第二音节词。所有目标词均基于随机抽样与日常使用熟悉度两大标准,通过葡萄牙语词典网站https://www.dicio.com.br/筛选获得。
在两类以元音结尾的目标词集中,又根据音节数量分为双音节(dissílabos)、三音节(trissílabos)、四音节(quadrissílabos)三个子群组,同时还会考虑目标元音前的辅音发音方式。根据目标元音前的辅音发音方式,两类元音的前置辅音分布如下:以[ɪ]结尾的词中,前置鼻音共6种、清塞音9种、浊塞音9种、清擦音9种、浊擦音9种、闪颤音6种、边音3种;以[ʊ]结尾的词中,前置鼻音共6种、清塞音10种、浊塞音8种、清擦音9种、浊擦音9种、闪颤音6种、边音3种。
8名受试者均在专业声学实验室完成录音。本次数据采集使用的设备包括:Behringer C-1电容麦克风、AKG K92头戴式耳机、Behringer U-PHORIA UMC 404HD音频接口,以及搭载1TB存储空间的第七代英特尔酷睿i5戴尔笔记本电脑,用于呈现实验幻灯片。录音采用WAV格式,采样率设置为44.1 kHz。
所有受试者均遵循统一的数据采集流程:将102个目标词嵌入载体句"我小声说______"中。采用标准化载体句的目的是尽可能统一目标尾元音所处的语音环境,以便与其他使用同类实验范式的研究进行结果对比。
本实验在受控环境中测量了以下参数:尾重读音节与非重读音节的第一共振峰(F1)值、尾元音总时长、相对时长、平均基频(F0)以及基频标准差,并将上述参数与另一语音环境下测得的对应数值进行对比。为完成上述对比,本研究编制了两篇短篇叙事文本,文本涵盖了此前筛选的全部目标词,由所有受试者进行朗读。该设计旨在提升语音自然度,以便在两种实验情境下对声学测量结果进行直接对比。
102个目标词被嵌入载体句后,通过研究者笔记本电脑上的PowerPoint幻灯片逐一呈现,共对应102张演示幻灯片。研究者要求8名受试者以随机顺序,将所有载体句各重复朗读3次。为帮助受试者适应实验环境、熟悉目标词与录音流程,避免因不熟悉词汇出现发音失误或停顿犹豫,实验首先进行了一轮预录音。该轮预录音数据将被弃用。
在完成两类目标词(分别以[e]和[o]结尾,对应前文的[ɪ]与[ʊ]尾元音)的第三轮重复朗读后,每名受试者需以自身舒适且日常的语速,各朗读一次两篇短篇叙事文本(分别对应两类目标词组),文本同样通过研究者的笔记本电脑呈现。载体句与叙事文本的录音均将用于后续声学分析。
录音完成后,数据将通过两个步骤进行处理:首先使用PRAAT(Boersma & Weenink, 2019)6.1.03版本进行声学分析;随后采用RStudio 2021.09.0版本完成统计分析。在Praat软件中,所有尾重读音节与非重读音节的元音将被统一分割并标注在同一注释层中,而对应的目标词则单独标注在另一图层。前置辅音将被标注在独立图层,以记录目标词的前置语音语境。对于叙事文本中的目标词,额外增设图层用于记录前置辅音与后续语音语境,后续语境可为辅音、元音甚至静默片段。
借助Praat软件生成的TextGrid文本栅格完成所有音频的分割后,本研究使用由Barbosa(2024)开发的GenAcousticsSegments脚本,自动提取目标元音的第一共振峰(F1,单位:Hz)、尾非重读音节元音总时长、平均基频(F0)、基频标准差以及频谱强调度(参考Traunmüller & Eriksson, 2000),同时自动记录音频文件名(包含受试者信息与尾元音类型)以及语境标注标签。受试者性别与学历信息,以及目标元音(尾非重读音节元音)的相对时长,则通过手动填写至输出文件中完成补充。
提供机构:
Repositório de Dados de Pesquisa da Unicamp
创建时间:
2024-12-20



