five

FrancophonIA/NTEU_French-Lithuanian

收藏
Hugging Face2025-03-29 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/FrancophonIA/NTEU_French-Lithuanian
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个用于训练NTEU机器翻译引擎的法语-立陶宛语平行语料库资源集合。数据集包括两个TMX文件,分为两个等级,按照数据源的可靠性分组。等级A包含来自人工编辑源、翻译记忆等的数据;等级B包含来自各种网络和并行文档源自动对齐的平行数据。数据集包含了来自欧盟科技中心、OPUS网站、Tilde MODEL语料库集合等多个来源的平行语料库资源。

This is a compilation of parallel corpora resources used for training of NTEU Machine Translation engines. The dataset includes two TMX files, divided into two tiers based on the reliability of the data sources. Tier A contains data from human-edited sources, translation memories, etc., while Tier B contains parallel data automatically aligned from various web and parallel document sources. The dataset comprises parallel corpora resources from multiple sources such as the European Commissions Science Hub, OPUS website, Tilde MODEL corpora collection, etc.
提供机构:
FrancophonIA
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作