CasANER
收藏DataCite Commons2026-02-11 更新2026-05-04 收录
下载链接:
https://www.ortolang.fr/market/item/casaner/v1
下载链接
链接失效反馈官方服务:
资源简介:
CasANER est un outil de reconnaissance d'entités nommées
dans des textes en arabe. Suite à une collaboration entre le Laboratoire d'informatique
fondamentale et appliquée (Lifat) de l'université de Tours et le Laboratoire Multimedia, InfoRmation systems
and Advanced Computing Laboratory (Miracl) de l'université de Sfax, collaboration entre, d'une
part, Denis Maurel et Nathalie Friburger et, d'autre part, Kais Haddar, une
codirection de thèse a été mise en place entre l'université de Tours et celle
de Tunis El Manar. L'étudiante concernée, aujourd'hui docteur, Fatma Ben Mesmia
Chaabouni, a réalisé un système de reconnaissance des entités nommées en langue
arabe, basé sur les mêmes principes que le système CasEN développé au
Lifat. Ce travail entre dans le cadre plus général du projet Prolex, qui a
pour but de fournir, à la communauté du traitement automatique des langues
(Tal), des connaissances sur les noms propres.
Les entités nommées reconnues ici sont les entités nommées
classiques en traitement automatique des langues, à savoir les noms propres,
les mesures et les dates.
-----
La reconnaissance des entités nommées par la cascade
d'analyse CasANER utilise des ressources lexicales et des descriptions locales
de motifs, des transducteurs qui agissent sur le texte par des insertions,
remplacements ou suppressions. Ces actions peuvent éventuellement être
itératives. Elles peuvent aussi se faire "à la volée" sur un texte
particulier en fonction des résultats des transducteurs précédents. La
plateforme Unitex permet une écriture
et une maintenance faciles de ces transducteurs en les présentant à
l'utilisateur sous forme de graphes. Le principe d'une cascade est de pouvoir
utiliser dans les descriptions suivantes les motifs déjà détectés ou, au
contraire, d'éviter un étiquetage non souhaité pour un motif déjà reconnu.
提供机构:
ORTOLANG (Open Resources and TOols for LANGuage) - www.ortolang.fr
创建时间:
2026-02-11



