sanganaka/sanskrit_word_segmentation_dataset_2017

Name: sanganaka/sanskrit_word_segmentation_dataset_2017
Creator: sanganaka
Published: 2025-08-01 13:15:11
License: 暂无描述

Hugging Face2025-08-01 更新2025-08-09 收录

下载链接：

https://hf-mirror.com/datasets/sanganaka/sanskrit_word_segmentation_dataset_2017

下载链接

链接失效反馈

官方服务：

资源简介：

梵文单词切分和形态学候选数据集，包含标注了黄金标准单词切分、词根形式和形态学标签的梵文句子，以及基于图的形态学候选分析。适用于单词切分、词形还原、形态学分析、基于图的消歧以及低资源自然语言处理任务。

Sanskrit Word Segmentation and Morphological Candidate Dataset, containing Sanskrit sentences annotated with gold-standard word segmentations, lemmas, and morphological tags, as well as graph-based morphological candidate analyses. Suitable for tasks such as word segmentation, lemmatization, morphological analysis, graph-based disambiguation, and low-resource NLP.

提供机构：

sanganaka

5,000+

优质数据集

54 个

任务类型

进入经典数据集