Modélisation Contrastive et Computationnelle des Chaînes de Coréférence
收藏DataCite Commons2026-02-11 更新2026-05-04 收录
下载链接:
https://www.ortolang.fr/market/item/mc4/v1
下载链接
链接失效反馈官方服务:
资源简介:
Le corpus MC4 a été constitué par les membres participants du projet MC4. Le projet a pour but d’annoter les phénomènes référentiels, à savoir un ensemble défini d’indices présents dans le texte. Chacun de ces indices est nommé « maillon » et entre dans la constitution d’une « chaîne de référence ».Le corpus écrit du projet MC4 comprend 8 textes, soit environ 18 000 mots et 3800 maillons. L’ensemble des textes réunis n’est pas homogène puisque constitué de textes en vers ou en prose, d’époques différentes, de longueur variable, correspondant ou non à l’ensemble de l’œuvre, à savoir : 6 récits du Gracial d’Adgar (12e s, vers), le premier livre des Quatre Livres des Rois (12e s, prose), La vie de Saint Thomas de Becket (12e s, vers), Li Estoires de Chiaus qui conquisent Coustantinoble de Robert de Clari (12e-13e s, prose), la Queste del saint Graal (13e s, prose), Les Bijoux et La mère sauvage de Maupassant (20e s, prose).Cette hétérogénéité s’explique par une volonté de réunir – et de traiter de manière homogène – des phénomènes référentiels variés, dans des états de langue variés, afin de permettre des comparaisons a posteriori. En effet, le groupe MC4 est composé de linguistes de formations et de domaines de spécialité variés : certains s’intéressent plutôt à la syntaxe, d’autres à la sémantique, certains ont pour objet d’étude l’ancien français, avec une approche diachronique, d’autres le français moderne, etc. Le corpus constitué est le reflet de cette diversité.Le corpus a été constitué avec le logiciel Analec et que Analec permet de le consulter. Analec peut-êter récupéré à l'adresse : http://www.lattice.cnrs.fr/Telecharger-Analec
提供机构:
ORTOLANG (Open Resources and TOols for LANGuage) - www.ortolang.fr
创建时间:
2026-02-06



