five

Prolex

收藏
DataCite Commons2026-02-11 更新2026-05-04 收录
下载链接:
https://www.ortolang.fr/market/item/prolex/v1
下载链接
链接失效反馈
官方服务:
资源简介:
Le projet Prolex, piloté par le Laboratoire d'informatique (LI) de l'université François-Rabelais de Tours, a pour but de fournir, à la communauté du traitement automatique des langues (Tal), des connaissances sur les noms propres, qui constituent, à eux seuls, 10% des textes journalistiques. Ceci par la création d'une plate-forme technologique comprenant un dictionnaire électronique relationnel multilingue de noms propres (Prolexbase), des systèmes d'identification des noms propres et de leurs dérivés, des grammaires locales, etc.La ressource Prolexbase est un projet Tal du LI, en collaboration avec ;le laboratoire ligérien de linguistique ;l'université de Belgrade ;l'académie des sciences de Varsovie.Ce projet a reçu le soutien :de l'action Technolangue du Ministère de l'Industrie (2003-2005) ;du programme d'action intégré Egide Pavle-Savic du Ministère des Affaires étrangères (2004-2005) ;du projet Feder Région Centre Entités nommées et nommables (2009-2010) ;du projet ERDF Nekst (2009-2014) ;du projet européen (CIP ICT-PSP) Cesar (2011-2013).La modélisation du domaine des noms propres définie dans le projet Prolex repose sur deux concepts centraux : le pivot et le prolexème. Le pivot ne représente pas le référent, mais un point de vue sur ce référent. Il possède dans chaque langue un concept spécifique, le prolexème, qui est une famille structurée de lexèmes. Autour d'eux, sont définis d’autres concepts et des relations (synonymie, méronymie, accessibilité, éponymie, etc.). Chaque pivot est en relation d’hyperonymie avec un type et une existence au sein de deux typologies.Il n'est pas évident de définir la notion de nom propre. La plupart des définitions insistent sur le caractère unique de son référent et sur une sémantique et une syntaxe qui lui est propre. Nous avons choisi d’adopter le point de vue de (Jonasson, 1994) qui propose une définition plus large incluant ce qu'elle appelle les noms propres purs (noms de personne et noms de lieu) et les noms propres descriptifs qui résultent souvent de la composition d’un nom propre avec une expansion (Tour Eiffel, musée Rodin, etc.). Un nom propre descriptif peut être considéré comme une expression définie figée ou en cours de figement (Jardin des Plantes, Médecins sans frontières, etc.). Cette définition est assez proche de celle utilisée dans le domaine du Tal depuis la conférence MUC6.Contenu : Nombre de langues : 10 (principalement le français, l'anglais et le polonais)Nombre de pivots : 73 365Nombre de relations : 72 604 (3 908 accessibilités, 67 417 méronymies et 1 279 synonymies)Nombre d'entrées lexicales en français : 96 800 (75 501 noms propres et 21 299 dérivés, soit 147 518 formes)Nombre d'entrées lexicales en anglais : 19 449 (19 355 noms propres et 94 dérivés, soit 19 449 formes)Nombre d'entrées lexicales en polonais : 39 020 (35 937 noms propres et 3 083 dérivés, soit 165 309 formes)
提供机构:
ORTOLANG (Open Resources and TOols for LANGuage) - www.ortolang.fr
创建时间:
2026-02-11
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作