five

hind_encorp

收藏
Opencsg2024-07-19 更新2025-05-03 收录
下载链接:
https://www.opencsg.com/datasets/AIWizards/hind_encorp
下载链接
链接失效反馈
官方服务:
资源简介:
HindEnCorp主要用于机器翻译任务,它提供英地平行文本,规模在10万到100万个样本之间。数据来源于Tides、Daniel Pipes的评论、EMILLE等多个来源,并通过众包和机器生成的方式进行语言创作。数据集中包含源标识符、对齐类型、对齐质量以及英语和印地语的文本片段等字段。数据集采用CC BY-NC-SA 3.0授权许可。
创建时间:
2024-07-19
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作