five

Lexique4linguists

收藏
DataCite Commons2026-02-10 更新2026-05-04 收录
下载链接:
https://www.ortolang.fr/market/item/lexique4linguists/v1
下载链接
链接失效反馈
官方服务:
资源简介:
Lexique4linguists fournit un équivalent de la base de données lexicale du français Lexique dans sa version la plus récente sous une forme plus adaptée aux besoins des linguistes. La base de données est construite à partir des deux types d’unités lexicales généralement reconnues et étudiées par les linguistes, à savoir les mots (ou formes fléchies) et les lexèmes. Afin de répondre au mieux aux études de morphologie flexionnelles, elle comprend un jeu de données spécifique sur le modèle de la base de données Flexique en répertoriant pour chacune des trois catégories flexionnelles la liste de tous les paradigmes attestés. En complément des lexiques, Lexique4linguists fournit aussi le corpus complet dont sont extraites les données lexicales. Enfin, en vue de faire de lexique4linguists une ressource linguistique généraliste, nous avons complété la base de données en extrayant les ngrams de mots du corpus. L’ensemble des ressources sont dans un format xml TEI, le classique de la TEI P5 pour les textes et le format dérivé TEI-lex pour les lexiques et ngrams.ATTENTION: le corpus est en licence sans utilisation commerciale, conformément à la licence d'origine du corpus OpenSubtitles 2018.
提供机构:
ORTOLANG (Open Resources and TOols for LANGuage) - www.ortolang.fr
创建时间:
2026-02-10
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作