five

DériF

收藏
DataCite Commons2026-02-10 更新2026-05-04 收录
下载链接:
https://www.ortolang.fr/market/item/derif/v1
下载链接
链接失效反馈
官方服务:
资源简介:
DériF (Dérivation en Français) est un analyseur du lexique morphologiquement construit du Français. Contrairement à ce que son nom laisse croire, DériF analyse non seulement les unités du lexique construites par dérivation (c'est-à-dire suffixées : SCOLAIRE/ADJ, préfixées APPAUVRIR/VERBE, converties : IMPERMEABLE/NOM) mais aussi celles formées par composition savante ou néoclassique (ANTHROPOPHAGE/ADJ). Le raisonnement mis en oeuvre par DériF s'inspire des théories du courant lexématique de la morphologie. Ce système est donc basé sur l'utilisation de principes et contraintes linguistiques théoriques. DériF analyse un lemme étiqueté au moyen de sa catégorie grammaticale (NOM, VERBE, ADJ, ADV), hors contexte. Chaque étape d'analyse produit le lemme de base, avec sa catégorie (cf. 1a). Le procédé est réitéré tant que la dernière sortie produite est analysable comme morphologiquement construite (cf. 2a, 2b). Si une forme est graphiquement ambiguë, alors Dérif produit sous forme de liste toutes les analyses possibles, puis la récursion s'applique à chaque élément de la liste (cf. 3a-3d). En dehors de ces propriétés, DériF est capable de produire deux types d'informations syntaxico-sémantiques sur les lemmes étiquetés reliés par une règle morphologique : la pseudo-définition du lemme analysé, calculée par rapport à sa base (cf. 1b, 2c, 3b,3d), un ensemble de traits reflétant les contraintes que la règle impose à la base et au construit : par exemple lors de l'analyse de APPAUVRIR, DériF affecte à l'adjectif (cf. 4a) les traits indiquant que celui-ci désigne une propriété munie d'une borne initiale (i.e. non inhérente); de même DériF affecte au verbe (cf. 4b) les informations précisant que celui-ci dénote un accomplissement, et qu'il est transitif ; enfin Dérif prévoit que la relation entre la base et le verbe construit (cf. 4c) est telle que le premier renvoie à l'état final dans lequel se trouve l'object direct (patient) du verbe, à la fin du déroulement du prédicat incarné par celui-ci. Exemples scolaire/ADJ==gt; [ [ scol N* ] aire ADJ] (scolaire/ADJ, scol/N*) "En rapport avec le(s) école" appauvrissement/NOM==gt; [ [ a [pauvre ADJ ] VERBE] ment NOM] (appauvrissement/NOM, appauvrir/VERBE, pauvre/ADJ) " (Action - résultat de l'action) de appauvrir" importable/ADJ==gt; [ in [[ porter VERBE] able ADJ] ADJ] (importable/ADJ, portable/ADJ, porter/VERBE) "Non portable" [ [ importer VERBE] able ADJ] (importable/ADJ, importer/VERBE) "(lequel - Que l') on peut importer" pauvre/ADJ: @1 [typeA = propriété, borne = oui, binit = oui ] appauvrir/VERBE: [ aspect = accompl ; sous_cat = lt; NPagent, @2 NPpatient gt; ]; rel = prop( @1 ) = état_final( @2 ) Format d'entréeL'utilisateur peut interroger DériF de deux manières : en fournissant au clavier un lemme muni d'une étiquette grammaticale. L'ensemble est entré suivant la notation : lt;lemmegt;,lt;CATgt; ou lt;lemmegt;/lt;CATgt; lt;CATgt; est l'une des séquences suivantes VERBE, NOM, ADJ, ADV lt;lemmegt; est une chaîne de caractères représentant la forme citationnelle (non fléchie) qui vérifie la catégorie lt;CATgt;.Par convention, - la forme citationnelle d'un nom est son singulier, - la forme citationnelle d'un adjectif est son masculin-singulier, - la forme citationnelle d'un verbe est son infinitif en fournissant au programme un ensemble de données codées dans un fichier. Le fichier contenant les données à analyser est codé en ISO-8859-1. Chaque ligne comporte un lemme étiqueté au format indiqué au point (1). Format de sortieLorsque l'utilisateur choisit d'analyser une liste de lemmes, il a le choix entre trois formats de sortie : Triplet : déjà présenté supra, exemples (1) à (3). Chaque résultat est un triplet comportant l'historique de l'analyse sous la forme de listes crochetées, la liste des éléments de la famille du lemme analysé, le sens du lemme analysé, sous la forme d'une relation en langue naturelle établie en fonction de la valeur de la base Plat : chaque résultat est formulé sous la forme d'une suite linéaire d'informations, complétée par une série de traits caractérisant chaque élément de la famille du lemme analysé (voir exemple 4). Le format plat est notamment destiné à alimenter une base de données. Il sert aussi de pivot au format xml XML : le format de sortie consiste en une arborescence xml Lorsqu'il choisit d'analyser un lemme seul, la sortie est au format triplet.Échantillon de sortie Tripletappauvrir/VERBE==gt; [ a [pauvre ADJ ] VERBE] (appauvrir/VERBE, pauvre/ADJ) "Rendre pauvre"Échantillon de sortie Plat2,ADJ/a/pre/VERBE+pauvre/ADJ" Rendre pauvre" pauvre/ADJ: @1 [typeA = propriété, borne = oui, binit = oui ] appauvrir/VERBE: [ aspect = accompl ; sous_cat = lt; NPagent, @2 NPpatient gt; ] ; rel = prop( @1 ) = état_final( @2 )Échantillon de sortie XMLlt;?xml version='1.0' encoding='ISO-8859-1'?gt; lt;Derif version='v3'gt; lt;DerifResultgt; lt;Lemmegt;appauvrirlt;/Lemmegt; lt;Categorygt;VERBElt;/Categorygt; lt;Analyses NbDInterpretations='1' NbDInterpretationsConstruites='1'gt; lt;Analysegt; lt;AsItWasgt; 2,ADJ/a/pre/VERBE+pauvre/ADJ" Rendre pauvre" lt;/AsItWasgt; lt;FamilySizegt;2lt;/FamilySizegt; lt;Stepsgt; lt;Step number='1' gt; lt;Derivedgt;appauvrirlt;/Derivedgt; lt;DerivedCategorygt;VERBElt;/DerivedCategorygt; lt;MorphologicalProcessgt;alt;/MorphologicalProcessgt; lt;MorphologicalProcessTypegt;prelt;/MorphologicalProcessTypegt; lt;Basegt;pauvrelt;/Basegt; lt;BaseCategorygt;ADJlt;/BaseCategorygt; lt;/Stepgt; lt;/Stepsgt; lt;InputBaseRelationgt; Rendre pauvrelt;/InputBaseRelationgt; lt;InputBaseRelationModelgt; Rendre ADJlt;/InputBaseRelationModelgt; lt;/Analysegt; lt;/Analysesgt; lt;/DerifResultgt; lt;/Derifgt; Compléments XML à télécharger La DTD et le schéma RelaxNG décrivent la structure du document XML. Ils indiquent les éléments pouvant apparaître et leur contenu en terme d'éléments et d'attributs.La feuille de style XSL décrit la façon dont doit être affiché le document XML par votre navigateur Internet. Par défaut, seules la DTD et la feuille de style sont associées au fichier de sortie de format XML. Après téléchargement, elles doivent être placées dans le même dossier que ce dernier pour que l'association fonctionne.
提供机构:
ORTOLANG (Open Resources and TOols for LANGuage) - www.ortolang.fr
创建时间:
2026-02-10
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作