five

eBible Corpus

收藏
arXiv2023-04-20 更新2024-06-21 收录
下载链接:
https://github.com/BibleNLP/ebible
下载链接
链接失效反馈
官方服务:
资源简介:
eBible Corpus是由SIL国际创建的一个包含1009个圣经翻译部分的数据集,涵盖了833种不同语言,跨越75个语系。该数据集旨在支持低资源语言的机器翻译研究,特别是圣经翻译领域。数据集内容包括多种语言的圣经文本,大小和数据量因语言而异。创建过程涉及收集、解析和清洗来自eBible.org的翻译,确保其使用许可的兼容性。该数据集的应用领域主要是支持圣经翻译工作,解决低资源语言翻译的挑战,并提供模型性能基准。
提供机构:
SIL国际
创建时间:
2023-04-20
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作