five

Pratyaya-Kosh

收藏
arXiv2020-10-25 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2010.12937v1
下载链接
链接失效反馈
官方服务:
资源简介:
Pratyaya-Kosh是由印度理工学院-德里的研究团队创建的一个梵文后缀和屈折词(padas)的基准语料库,旨在评估和改进梵文衍生名词分析的工具和方法。该数据集包含24,757个主要衍生名词(Kridanta)和3,088个次要衍生名词(Taddhitanta),每个记录由动词词干、krit后缀和Kridanta或名词、taddhit后缀和Taddhitanta组成。数据集的创建过程涉及从多个来源提取数据,并使用机器学习算法进行处理。Pratyaya-Kosh的应用领域主要集中在梵文语言的形态分析,旨在解决梵文文本分析中的形态学问题,特别是在衍生名词的形成和分析方面。

Pratyaya-Kosh is a benchmark corpus of Sanskrit suffixes and inflected words (padas) developed by a research team from the Indian Institute of Technology Delhi, aiming to evaluate and enhance tools and methods for Sanskrit derived noun analysis. This corpus contains 24,757 primary derived nouns (Kridanta) and 3,088 secondary derived nouns (Taddhitanta). Each record follows one of two structural formats: either a verb stem, a krit suffix, and the corresponding Kridanta, or a noun, a taddhit suffix, and the corresponding Taddhitanta. The construction of Pratyaya-Kosh involves extracting data from multiple sources and processing it using machine learning algorithms. The primary application scope of Pratyaya-Kosh focuses on morphological analysis of the Sanskrit language, aiming to address morphological issues in Sanskrit text analysis, particularly those related to the formation and analysis of derived nouns.
提供机构:
印度理工学院-德里
创建时间:
2020-10-25
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作