five

EN80jours

收藏
DataCite Commons2026-02-11 更新2026-05-04 收录
下载链接:
https://www.ortolang.fr/market/item/en80jours/v1
下载链接
链接失效反馈
官方服务:
资源简介:
Le corpus EN80jours a été créé dans le cadre d’une étude contrastive des noms propres en traduction. De ce fait, il comporte le texte source en français, Le Tour du monde en quatre-vingts jours (Jules Verne, 1872), annoté au niveau des noms propres (mais aussi des noms relationnels et des adjectifs relationnels), grâce à l’outil CasEN et entièrement relu par Émeline Lecuit. Ce texte est aligné, grâce à l'outil XAlign, intégré à Unitex, avec trois textes cibles, en anglais, allemand et serbe (en alphabet latin). Cet alignement a lui aussi été relu par Émeline Lecuit et Duško Vitas. Ce travail est plus généralement inclu dans le projet Prolex.----------Les éléments de cette annotation ont été choisis parmi ceux proposés par la TEI. Le texte-source (français) est ainsi annoté au niveau : Des noms propres (3342 items) : [humain] (1856 items)[animal] (8 items)[organisation] (115 items)[lieu géographique naturel] (201 items)[axe de circulation] (63 items)[construction humaine] (68 items)[région administrative, ville] (836 items)[produit] (5 items)[vaisseau] (159 items)[journal] (23 items)[période historique] (3 items)[événement historique] (5 items) Des noms relationnels : [nom relationnel] (197 items)Des adjectifs relationnels : [adjectif relationnel] (161 items)----------Nous fournissons, en plus de ce corpus, des fichiers d’alignement, utilisables avec Unitex : ils permettent la visualisation de bi-textes, qui se présentent sous la forme d’une fenêtre divisée en deux parties, avec de part et d’autre les deux versions d’un même texte alignées horizontalement sur le plan des unités de traduction ou équivalents traductionnels.
提供机构:
ORTOLANG (Open Resources and TOols for LANGuage) - www.ortolang.fr
创建时间:
2026-02-11
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作