five

AI4Bharat-IndicNLP corpus

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/anoopkunchukuttan/indic_nlp_library
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集为德拉维达语系的单语数据集,旨在用于评估统一书写系统对语言的影响。该数据集的任务是对无监督翻译进行单语数据分析。

This is a monolingual dataset of the Dravidian language family, purpose-built to evaluate the impact of unified writing systems on languages. The task of this dataset is to conduct monolingual data analysis related to unsupervised translation.
提供机构:
AI4Bharat
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作