five

Itih¯asa

收藏
arXiv2021-10-06 更新2024-06-21 收录
下载链接:
https://github.com/rahular/itihasa
下载链接
链接失效反馈
官方服务:
资源简介:
Itih¯asa是一个大规模的梵文到英语翻译数据集,包含93,000对梵文shlokas及其英文翻译。该数据集从印度两大史诗《罗摩衍那》和《摩诃婆罗多》中提取,旨在通过自动翻译系统加速文献的数字化和翻译过程,促进知识的民主化。数据集的创建涉及自动OCR提取和手动检查对齐错误,确保文本的高准确性。Itih¯asa的应用领域包括提高梵文自然语言处理工具的性能,解决梵文文献翻译的复杂性问题。
提供机构:
哥本哈根大学
创建时间:
2021-06-07
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作