five

Persian Parallel Corpus

收藏
arXiv2014-04-18 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/1404.4572v1
下载链接
链接失效反馈
官方服务:
资源简介:
Persian Parallel Corpus是由伊朗科技大学与德黑兰大学合作创建的第一个波斯语与多种欧洲语言的平行语料库。该数据集包含110,000个Tokens,旨在为波斯语提供基本语言资源工具包(BLARK)。数据集的创建过程涉及波斯语的形态句法规范和电子文本表示标准的制定。该数据集主要应用于自然语言处理领域,特别是机器翻译和语言计算分析,以促进波斯语在信息和通信技术中的应用。

The Persian Parallel Corpus is the first parallel corpus pairing Persian with multiple European languages, jointly created by Sharif University of Technology and the University of Tehran. This dataset contains 110,000 Tokens, and is designed to provide the Basic Language Resource Kit (BLARK) for the Persian language. The construction of this dataset involved the establishment of morphosyntactic norms and electronic text representation standards for the Persian language. This dataset is primarily utilized in the field of natural language processing, particularly machine translation and computational linguistic analysis, to promote the application of the Persian language in information and communications technology.
提供机构:
伊朗科技大学与德黑兰大学
创建时间:
2014-04-18
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作