hind_encorp
收藏Opencsg2024-07-19 更新2025-05-03 收录
下载链接:
https://www.opencsg.com/datasets/AIWizards/hind_encorp
下载链接
链接失效反馈官方服务:
资源简介:
HindEnCorp主要用于机器翻译任务,它提供英地平行文本,规模在10万到100万个样本之间。数据来源于Tides、Daniel Pipes的评论、EMILLE等多个来源,并通过众包和机器生成的方式进行语言创作。数据集中包含源标识符、对齐类型、对齐质量以及英语和印地语的文本片段等字段。数据集采用CC BY-NC-SA 3.0授权许可。
创建时间:
2024-07-19



