HindEnCorp
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/HindEnCorp
下载链接
链接失效反馈官方服务:
资源简介:
印地语和英语的平行语料库,以及 HindMonoCorp,印地语的单语语料库,发布版本 0.5。两个语料库都是从网络资源中收集的,主要用于统计机器翻译系统的训练。 HindEnCorp 由 274k 平行句子(390 万印地语和 380 万英语标记)组成。 HindMonoCorp 在 4400 万个句子中达到 7.87 亿个代币。
提供机构:
OpenDataLab
创建时间:
2022-05-23



