five

CAMFR : Corpus Annoté de Moyen-FRançais

收藏
DataCite Commons2026-02-11 更新2026-05-04 收录
下载链接:
https://www.ortolang.fr/market/item/camfr-treebank-mf-fpc/v1
下载链接
链接失效反馈
官方服务:
资源简介:
Ce petit corpus CAMFR, diffusé au format CoNLL-U, a été élaboré à partir d’un échantillon de 10 romans en prose des 16e et 17e siècles. Ces romans correspondent aux deux états de langues du moyen français et du français pré-classique.Lors de l’annotation manuelle, le choix des étiquettes s’est porté sur le standard du consortium Universal Dependencies. Le guide d’annotation joint en annexe précise les choix réalisés en termes d’analyses morphologiques et syntaxiques (lemmes, parties du discours, traits, dépendances). Il a fait l'objet d'une double annotation initiale sous Arborator, ensuite corrigée et harmonisée par les 4 participants au projet (Corinne Denoyelle, Adam Renwick, Olivier Kraif et Julie Sorba).Il comporte 1224 tokens (formes et ponctuations) et autant d'étiquettes morphosyntaxiques et d'étiquettes de relations de dépendances. Il pourra servir d'amorce à un corpus de français pré-classique, encore peu représenté parmi les corpus arborés. p { line-height: 115%; text-align: left; orphans: 2; widows: 2; margin-bottom: 0.25cm; direction: ltr; background: transparent }p.western { font-family: "Arial", serif; font-size: 11pt }p.cjk { font-size: 11pt }a:link { color: #0563c1; text-decoration: underline }a:visited { color: #954f72; text-decoration: underline }
提供机构:
ORTOLANG (Open Resources and TOols for LANGuage) - www.ortolang.fr
创建时间:
2026-02-11
二维码
社区交流群
二维码
科研交流群
商业服务