CAMFR : Corpus Annoté de Moyen-FRançais
收藏DataCite Commons2026-02-11 更新2026-05-04 收录
下载链接:
https://www.ortolang.fr/market/item/camfr-treebank-mf-fpc/v1
下载链接
链接失效反馈官方服务:
资源简介:
Ce petit corpus CAMFR, diffusé au format CoNLL-U, a été élaboré à partir d’un
échantillon de 10 romans en prose des 16e et 17e
siècles. Ces romans correspondent aux deux états de langues du moyen français et du français pré-classique.Lors de l’annotation manuelle, le choix des étiquettes
s’est porté sur
le standard du consortium Universal Dependencies.
Le guide d’annotation joint en annexe précise les choix réalisés
en termes d’analyses morphologiques et syntaxiques (lemmes, parties
du discours, traits, dépendances). Il a fait l'objet d'une double annotation initiale sous Arborator, ensuite corrigée et harmonisée par les 4 participants au projet (Corinne Denoyelle, Adam Renwick, Olivier Kraif et Julie Sorba).Il comporte 1224 tokens (formes et ponctuations) et autant d'étiquettes morphosyntaxiques et d'étiquettes de relations de dépendances. Il pourra servir d'amorce à un corpus de français pré-classique, encore peu représenté parmi les corpus arborés.
p { line-height: 115%; text-align: left; orphans: 2; widows: 2; margin-bottom: 0.25cm; direction: ltr; background: transparent }p.western { font-family: "Arial", serif; font-size: 11pt }p.cjk { font-size: 11pt }a:link { color: #0563c1; text-decoration: underline }a:visited { color: #954f72; text-decoration: underline }
提供机构:
ORTOLANG (Open Resources and TOols for LANGuage) - www.ortolang.fr
创建时间:
2026-02-11



