Corpus annoté en morphosyntaxe pour le poitevin-saintongeais - Projet DIVITAL
收藏DataCite Commons2026-04-24 更新2026-05-04 收录
下载链接:
https://nakala.fr/10.34847/nkl.fcea5066
下载链接
链接失效反馈官方服务:
资源简介:
Ce corpus annoté contient 16443 entrées (741 phrases) avec la forme, le lemme, la catégorie grammaticale selon le jeu d'étiquettes Universal Dependencies et une glose en français. Les documents annotés sont des extraits d'oeuvres originales en poitevin-saintongeais et d'oeuvres traduites en poitevin-saintongeais :
- Contes du lundi, A. Daudet
- Parabole de l’enfant prodigue
- Contes du marais, B. Bidaude & J.L. Le Quellec
- Chroniques sur les langues de France, M. Feltin-Palas
- Le Prinçot, A. de Saint-Exupéry
- Les lettres de mon moulin, A. Daudet
- Pierre et le loup, S. Prokofiev
- Fine Amour, M. Gautier
- 100 histoires de menteries en poitou-charentes-vendee, C. Ribouillault
- Décaméron, Boccace
- La déclaration universelle des droits de l’homme
- La bise et le soleil, Esope
- L’homme qui plantait des arbres, J. Giono
L’annotation a été réalisée par des linguistes non locuteurs. Pour le Corpus POS, une partie du corpus a fait l’objet d’une double annotation à l’aveugle, c’est-à-dire sans que les annotateurs aient accès aux annotations des autres — avant d’être comparée puis adjudiquée, une annotation consensuelle étant alors retenue comme annotation de référence pour 249 phrases (verification_status = validated). Les 492 phrases restantes n’ont fait l’objet que d’une annotation unique (verification_status = no validated).
提供机构:
NAKALA - https://nakala.fr (Huma-Num - CNRS)
创建时间:
2025-12-09



