five

Corpus annoté en morphosyntaxe pour le poitevin-saintongeais - Projet DIVITAL

收藏
DataCite Commons2026-04-24 更新2026-05-04 收录
下载链接:
https://nakala.fr/10.34847/nkl.fcea5066
下载链接
链接失效反馈
官方服务:
资源简介:
Ce corpus annoté contient 16443 entrées (741 phrases) avec la forme, le lemme, la catégorie grammaticale selon le jeu d'étiquettes Universal Dependencies et une glose en français. Les documents annotés sont des extraits d'oeuvres originales en poitevin-saintongeais et d'oeuvres traduites en poitevin-saintongeais : - Contes du lundi, A. Daudet - Parabole de l’enfant prodigue - Contes du marais, B. Bidaude & J.L. Le Quellec - Chroniques sur les langues de France, M. Feltin-Palas - Le Prinçot, A. de Saint-Exupéry - Les lettres de mon moulin, A. Daudet - Pierre et le loup, S. Prokofiev - Fine Amour, M. Gautier - 100 histoires de menteries en poitou-charentes-vendee, C. Ribouillault - Décaméron, Boccace - La déclaration universelle des droits de l’homme - La bise et le soleil, Esope - L’homme qui plantait des arbres, J. Giono L’annotation a été réalisée par des linguistes non locuteurs. Pour le Corpus POS, une partie du corpus a fait l’objet d’une double annotation à l’aveugle, c’est-à-dire sans que les annotateurs aient accès aux annotations des autres — avant d’être comparée puis adjudiquée, une annotation consensuelle étant alors retenue comme annotation de référence pour 249 phrases (verification_status = validated). Les 492 phrases restantes n’ont fait l’objet que d’une annotation unique (verification_status = no validated).
提供机构:
NAKALA - https://nakala.fr (Huma-Num - CNRS)
创建时间:
2025-12-09
二维码
社区交流群
二维码
科研交流群
商业服务