Itih¯asa
收藏arXiv2021-10-06 更新2024-06-21 收录
下载链接:
https://github.com/rahular/itihasa
下载链接
链接失效反馈官方服务:
资源简介:
Itih¯asa是一个大规模的梵文到英语翻译数据集,包含93,000对梵文shlokas及其英文翻译。该数据集从印度两大史诗《罗摩衍那》和《摩诃婆罗多》中提取,旨在通过自动翻译系统加速文献的数字化和翻译过程,促进知识的民主化。数据集的创建涉及自动OCR提取和手动检查对齐错误,确保文本的高准确性。Itih¯asa的应用领域包括提高梵文自然语言处理工具的性能,解决梵文文献翻译的复杂性问题。
提供机构:
哥本哈根大学
创建时间:
2021-06-07



