TLFi
收藏DataCite Commons2026-02-11 更新2026-05-04 收录
下载链接:
https://www.ortolang.fr/market/item/xml-tlfi/v1
下载链接
链接失效反馈官方服务:
资源简介:
La ressource distribuée provient du Trésor de la Langue Française (TLF) qui est un dictionnaire de la langue française du XIXe et XXe siècle publié par le Centre national de recherche scientifique (CNRS) entre 1971 et 1994. Sa réalisation a commencé au début des années 1960 au sein du Centre de recherche pour un Trésor de la langue française (CRTLF), fondé par Paul IMBS, devenu l'Institut national de la langue française (INALF) en 1981, puis le laboratoire Analyse et traitement informatique de la langue française (ATILF) en 2001. Il compte 16 tomes, 100 000 articles, 270 000 définitions et 430 000 exemples.En 1992, le laboratoire a pris la décision de transformer le dictionnaire papier (le TLF) en dictionnaire électronique (le TLFi). Le TLFi est consultable en ligne depuis 2002. Il a également été diffusé sous la forme d'un CD-ROM en 2004 et, depuis 2005, il est intégré au portail lexical du Centre National de Ressources Textuelles et Lexicales (CNRTL) et il fait partie des ressources affichées sur le nouveau portail lexical du laboratoire.En 2023, dans le cadre des grands chantiers du laboratoire, un groupe de travail animé par Jessika Cardinali et réunissant Évelyne Jacquey, Sandrine Ollinger et Étienne Petitjean s'est réuni très régulièrement afin d'analyser la ressource pour la traduire vers un format xml-utf8 revisité. Une première version de cette refonte de l'encodage de la ressource a été achevée fin 2025 et peut être mise à disposition. Elle s'appuie sur les grands principes suivants :Fidélité à la version papier qui fait référence et utilisation d'un jeu de balises permettant le traçage des modifications réalisées en cas de nécessité (modifications de contenu en très petit nombre) ;Choix d'une ressource primaire : plusieurs versions électroniques coexistaient. L'une d'elle a été choisie comme ressource primaire et les différences d'encodage existant entre cette ressource et les autres ressources existantes ont été traitées de manière à ne pas perdre le bénéfice des autres versions non choisies comme ressource primaire ;Enrichissement de l'information sans modification : lorsque des améliorations étaient possibles en matière de contenu (par exemple, expansion de certaines abréviations), elles ont été réalisées sans perdre le lien avec l'information d'origine. C'est notamment le cas de l'information grammaticale ;Mise en conformité plus nette entre jeux de balises et rôle dans la structuration de l'information lexicographique :Un jeu de balises de mise en forme : encodage typographique (une balise) et mise en forme textuelle (deux balises) ;Un jeu de balises pour les différents types de contenus lexicographiques (26 balises) ;Un jeu de balises pour les différents types de structures de l'information (une balise racine et 13 balises de structures).Des informations plus détaillées sont accessibles dans les deux documentations fournies dans ce dépôt.
提供机构:
ORTOLANG (Open Resources and TOols for LANGuage) - www.ortolang.fr
创建时间:
2026-02-11



