five

Teko filler baʔe

收藏
DataCite Commons2026-02-11 更新2026-05-04 收录
下载链接:
https://www.ortolang.fr/market/item/teko-bae/v1
下载链接
链接失效反馈
官方服务:
资源简介:
Description Cette collection de données accompagne un article sur le filler baʔe du teko, une langue tupi-guarani parlée en Guyane française et aussi connue sous le nom émérillon (Glotto: emer1243 ; ISO 639-3: eme). Rose, Françoise. One more thing ‘thing’ can do in Tupí-Guaraní languages : the Teko filler. In Pakendorf, Brigitte amp; Rose, Françoise (eds.), Fillers: hesitatives and placeholders, à paraître. La description linguistique la plus aboutie sur la langue est la suivante : Rose, Françoise. 2011. Grammaire de l’émérillon teko, une langue tupi-guarani de Guyane française (Langues et Sociétés d’Amérique Traditionnelle 10). Louvain : Peeters. Pour plus d’informations sur l’auteur, cf. sa page web. Source Les jeux de données ont été construits à partir de mon corpus de teko, recueilli entre 1999 et 2004 en Guyane française, essentiellement dans le village de Camopi, mais aussi à Cayenne et ses environs. Il est constitué de listes de mots, de données élicitées et de textes. Le corpus de teko est décrit dans l’article sur le filler du teko. Un extrait du corpus est déjà en accès libre dans les archives en ligne AILLA et Ortolang. Jeux de données Le dossier nommé « baʔe audio amp; Praat » contient deux fichiers par occurrence du mot baʔe dans les textes enregistrés: un fichier audio centré sur baʔe et incluant le mot précédent et le mot suivant, et un Textgrid Praat associé avec le fichier audio. Dans le Textgrid, la tire du bas identifie baʔe ainsi que le mot qui le précède et celui qui le suit, et spécifie son analyse comme nom pour « chose », hésitateur, placeholder, extender, ayant une fonction rhétorique, ou une analyse ambiguë, alors que la tire du haut propose une segmentation des voyelles du mot baʔe . Le fichier nommé « baʔe_database » liste les 103 occurrences de baʔe dans les textes enregistrés. Pour chaque occurrence, 9 paramètres ont été codés manuellement et des mesures de durée ont été extraites des fichiers audio à l’aide d’un script Praat. Les paramètres et les mesures sont présentés dans l’article associé. Ce jeu de données est proposé dans les formats csv et xlsx. Le fichier « LengthExtraction » est un script Praat écrit par ma collègue Jennifer Krzonowski pour extraire des mesures de durée des fichiers audio sur la base des TextGrids.
提供机构:
ORTOLANG (Open Resources and TOols for LANGuage) - www.ortolang.fr
创建时间:
2026-02-11
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作