Dakshina
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Dakshina
下载链接
链接失效反馈官方服务:
资源简介:
Dakshina 数据集是 12 种南亚语言的拉丁文和母语文本的集合。对于每种语言,数据集都包含大量本地脚本 Wikipedia 文本、一个罗马化词典,其中包含经过证明的罗马化的本地脚本中的单词,以及该语言的本地脚本和基本拉丁字母表中的一些完整句子并行数据.
提供机构:
OpenDataLab
创建时间:
2022-05-23



