five

quickmt/quickmt-train.ru-en

收藏
Hugging Face2025-09-07 更新2025-08-30 收录
下载链接:
https://hf-mirror.com/datasets/quickmt/quickmt-train.ru-en
下载链接
链接失效反馈
官方服务:
资源简介:
quickmt ru-en Training Corpus 数据集包含了多个经过去重和基本过滤处理的子数据集,这些子数据集来源于不同的渠道,包括commoncrawl、news_commentary、tedtalks、ELRC、OPUS等多个平台和项目,涵盖了从2012年到2021年的不同时间段。数据集包含了俄语(ru)和英语(en)两种语言的平行语料,适用于机器翻译等自然语言处理任务。

The quickmt ru-en Training Corpus dataset consists of multiple deduplicated and basic filtered subsets from various sources such as commoncrawl, news_commentary, tedtalks, ELRC, OPUS, etc., covering different time periods from 2012 to 2021. It includes parallel corpora in Russian (ru) and English (en), suitable for machine translation and other natural language processing tasks.
提供机构:
quickmt
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作