ParCoGLiJe
收藏DataCite Commons2026-02-10 更新2026-05-04 收录
下载链接:
https://www.ortolang.fr/market/item/stosic/v1
下载链接
链接失效反馈官方服务:
资源简介:
ParCoGLiJe est un corpus parallèle bilingue français-anglais destiné à l'étude des grands classiques de la littérature de jeunesse. Il contient 8 ouvrages en français et en anglais alignés avec leur traduction dans l'autre langue du corpus au niveau des chapitres, paragraphes et phrases. Le corpus comporte 1,6 million de mots et il est libre de droits. Les fichiers diffusés sont au format XML - normé TEI-P5. Quant à la structuration du contenu des ouvrages, de manière générale les chapitres correspondent aux éléments lt;divgt;, les paragraphes aux éléments lt;pgt;, et les phrases aux éléments lt;sgt;. Les fichiers dans les deux langues sont structurés de sorte à contenir le même nombre de ces éléments ; les segments parallèles d’un texte se trouvent donc au même endroit dans la structure XML. Un accent particulier a été mis sur le traitement qualitatif des textes, conformément aux choix méthodologiques propres au projet ParCoLab, dont ParCoGLiJe est un dérivé.La ressource a été créé au sein du Laboratoire CLLE-ERSS (UMR 5236 CNRS amp; Université Toulouse Jean Jaurès) grâce à un financement du consortium CORLI.
提供机构:
ORTOLANG (Open Resources and TOols for LANGuage) - www.ortolang.fr
创建时间:
2026-02-10



