BEL-RL-fr
收藏DataCite Commons2026-02-11 更新2026-05-04 收录
下载链接:
https://www.ortolang.fr/market/item/examples-ls-fr/v2
下载链接
链接失效反馈官方服务:
资源简介:
Le corpus BEL-RL-fr est une distribution de la base de citations lexicographiques du Réseau Lexical du français (RL-fr), modèle formel du lexique du français contemporain en cours de construction. Sa réalisation s'inscrit dans le cadre des travaux sur les Systèmes Lexicaux
menés sous la responsabilité d’Alain Polguère.Si vous désirez être informé de l'actualité concernant la distribution des données des Systèmes Lexicaux, inscrivez-vous sur la liste lexsys-distr en envoyant un courriel à l'adresse ">sympa@atilf.fr ayant pour objet subscribe syslex-distr lt;Votre prénomgt; lt;Votre nomgt; sans rien inscrire dans le corps du message. Vous recevrez alors un courriel vous invitant à confirmer votre demande.Chacune des citations qu‘il contient a été sélectionné avec soin pour servir d’exemple lexicographique en illustrant le sens et la combinatoire d’une unité lexicale et provient initialement de l’une des sources suivantes : la base de données textuelles Frantext, le corpus Web frWaC, le corpus journalistique issu de l’Est Républicain, le corpus OrthoCorpus, diverses sources hors corpus (Web, publications, supports audiovisuels, conversations, courriers, chansons).Dans de rares cas, les citations ont été fabriquées par les lexicographes.Le corpus suit cette organisation par sources, dans un format XML.Chaque citation, à l’exception des citations fabriquées, est associée à une date :date de publication (Frantext, Est Républicain, OrthoCorpus, publications hors corpus, support audiovisuel, chansons),date de consultation (Web),date de constitution du corpus (frWac),date de création.Seuls
56 citations sont antérieurs à 1950. Elles servent à illustrer des unités
lexicales aujourd'hui inactives en tant que telles, mais formellement
incluses dans des unités polylexicales. Chaque citation est accompagnée de sa bibliographie. Les occurrences des unités lexicales qu'elle sert à illustrer sont identifiées dans la citation à l'aide de balises lt;seg/gt;. Chaque occurrence est associée à l'ensemble d'informations suivant :un identifiant unique,un code qui renseigne le statut lexical de l’unité qu’elle illustre (statut phraséologique, pragmatique et langagier),un URI qui renvoie à sa partie du discours dans le modèle des caractéristiques grammaticales du RL-fr,une URL qui permet de visualiser la description de l'unité lexicale, actualisée quotidiennement.Un glossaire des codes employés pour les statuts lexicaux est disponible dans l'entête de chaque fichier.Le BEL-RL-fr constitue donc une ressource annotée manuellement en unités lexicales. Il est possible de reconstruire l’URI de chaque unité lexicale présente à partir des URL fournies, de la manière suivante : "https://spiderlex.atilf.fr/fr/id/35415" =gt; "ls:fr:node:35415"Remarque :1 587 citations comportent plusieurs segments textuels annotés avec la même unité lexicale. Il peut s'agir aussi bien d’occurrences multiples que d'occurrences disjointes.
On doit préconiser le numérotage des générations par des chiffres romains, et celui des individus, de la gauche à la droite dans chaque génération, par des chiffres arabes. Frantext, Sans mention d’auteur, L’Histoire et ses méthodes, 1961, p. 733Des fois, j’ai tellement mal que je peux pas me traîner jusqu’ici. Je me demande si je me suis pas déplacé un disque ?...— C’est l’âge. Frantext, Caradec François, La Compagnie des zincs, 1986, p. 102Statistiques :La version courante de BEL-RL-fr comporte :31 131 citations51 347 segments textuels annotés en unité lexicale
Changements par rapport à la V1 :La version 2 comporte un enrichissement des données de la version 1 : ajout de citations et ajouts de segments textuels annotés.De plus, elle intègre une partie du travail de révision réalisé par Camille Kuntz au cours de l'été 2020.Enfin, elle comporte une version TXM du corpus, pour la réalisation de laquelle nous avons bénéficié de l’aide d’Alexey Lavrentev, Matthieu
Decorde et Serge Heiden. Bibliographie :Ollinger S., Polguère A. (2020a) « Distribution des Systèmes Lexicaux. Version 2.0 ». Rapport technique, ATILF CNRS, Nancy.Lux-Pogodalla V. (2014) « Intégration relationnelle des exemples lexicographiques dans un réseau lexical ». Actes TALN (Traitement Automatique du Langage Naturel), Marseille, France, Juillet 2014.Heiden S., Magué J.-P.,
amp; Pincemin B. (2010). « TXM : Une plateforme logicielle
open-source pour la textométrie – conception et développement ». JADT 2010 : 10th International Conference on the Statistical Analysis of Textual Data, Rome, Italie, Juin 2010.
提供机构:
ORTOLANG (Open Resources and TOols for LANGuage) - www.ortolang.fr
创建时间:
2026-02-11



