five

FrancophonIA/DGT-TM-2016

收藏
Hugging Face2025-03-30 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/FrancophonIA/DGT-TM-2016
下载链接
链接失效反馈
官方服务:
资源简介:
DGT-TM是一个多语言翻译记忆库,包含了欧盟法律条文(Acquis Communautaire)的平行文本,覆盖了欧盟的23种官方语言。这个数据集是为了支持多语言主义和语言多样性,以及欧洲委员会信息的重用。它适用于多种场景,包括统计机器翻译系统的训练、制作词典和本体、信息提取软件的训练和测试等。

DGT-TM is a multilingual translation memory that contains parallel texts of the European Unions legal texts (Acquis Communautaire), covering all 23 official languages of the EU. This dataset is designed to support multilingualism, linguistic diversity, and the reuse of European Commission information. It is suitable for various scenarios, including training statistical machine translation systems, creating dictionaries and ontologies, training and testing information extraction software, etc.
提供机构:
FrancophonIA
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作