five

FrancophonIA/NTEU_French-Romanian

收藏
Hugging Face2025-03-29 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/FrancophonIA/NTEU_French-Romanian
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个用于构建机器翻译引擎的平行语料库资源编译,来源于NTEU项目(项目编号:2018-EU-IA-0051)。该资源包含两个TMX文件,分为两个等级,根据数据源可靠性分组。等级A包括来自人工编辑源、翻译记忆等的语料。等级B包括由各种网络和平行文档源自动对齐的平行数据创建的语料。具体包括来自不同网站和机构的多个平行语料库,如IATE术语、JRC-Acquis、EAC-TM、ECDC-TM、DGT-TM、DCEP、Tilde MODEL - eweSC、Global Voices、EU-Bookshop、OPUS - EMEA和Europarl v6等。

This is a compilation of parallel corpora resources used in building of Machine Translation engines in NTEU project (Action number: 2018-EU-IA-0051). The resource consists of two TMX files, two tiers grouped by data source reliability. Tier A includes data from human edited sources, translation memories, and similar. Tier B includes parallel data created by automatic aligning from various web and parallel document sources, such as IATE Terminology, JRC-Acquis, EAC-TM, ECDC-TM, DGT-TM, DCEP, Tilde MODEL - eweSC, Global Voices, EU-Bookshop, OPUS - EMEA, and Europarl v6.
提供机构:
FrancophonIA
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作