five

CasANER

收藏
DataCite Commons2026-02-11 更新2026-05-04 收录
下载链接:
https://www.ortolang.fr/market/item/casaner/v1
下载链接
链接失效反馈
官方服务:
资源简介:
CasANER est un outil de reconnaissance d'entités nommées dans des textes en arabe. Suite à une collaboration entre le Laboratoire d'informatique fondamentale et appliquée (Lifat) de l'université de Tours et le Laboratoire Multimedia, InfoRmation systems and Advanced Computing Laboratory (Miracl) de l'université de Sfax, collaboration entre, d'une part, Denis Maurel et Nathalie Friburger et, d'autre part, Kais Haddar, une codirection de thèse a été mise en place entre l'université de Tours et celle de Tunis El Manar. L'étudiante concernée, aujourd'hui docteur, Fatma Ben Mesmia Chaabouni, a réalisé un système de reconnaissance des entités nommées en langue arabe, basé sur les mêmes principes que le système CasEN développé au Lifat. Ce travail entre dans le cadre plus général du projet Prolex, qui a pour but de fournir, à la communauté du traitement automatique des langues (Tal), des connaissances sur les noms propres. Les entités nommées reconnues ici sont les entités nommées classiques en traitement automatique des langues, à savoir les noms propres, les mesures et les dates. ----- La reconnaissance des entités nommées par la cascade d'analyse CasANER utilise des ressources lexicales et des descriptions locales de motifs, des transducteurs qui agissent sur le texte par des insertions, remplacements ou suppressions. Ces actions peuvent éventuellement être itératives. Elles peuvent aussi se faire "à la volée" sur un texte particulier en fonction des résultats des transducteurs précédents. La plateforme Unitex permet une écriture et une maintenance faciles de ces transducteurs en les présentant à l'utilisateur sous forme de graphes. Le principe d'une cascade est de pouvoir utiliser dans les descriptions suivantes les motifs déjà détectés ou, au contraire, d'éviter un étiquetage non souhaité pour un motif déjà reconnu.
提供机构:
ORTOLANG (Open Resources and TOols for LANGuage) - www.ortolang.fr
创建时间:
2026-02-11
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作