aryaman/irumozhi
收藏Hugging Face2024-02-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/aryaman/irumozhi
下载链接
链接失效反馈官方服务:
资源简介:
---
license: mit
task_categories:
- text-classification
language:
- ta
tags:
- diglossia
pretty_name: IruMozhi
size_categories:
- n<1K
---
**IruMozhi** is a human-translated dataset of parallel text in Literary and
Spoken Tamil, using sentences taken from Wikipedia. For more details, see the
[paper](https://arxiv.org/abs/2311.07804).
提供机构:
aryaman
原始信息汇总
数据集概述
基本信息
- 许可证: MIT
- 任务类别: 文本分类
- 语言: 泰米尔语
- 标签: 双言现象
- 名称: IruMozhi
- 规模: n<1K
详细描述
IruMozhi是一个人工翻译的数据集,包含文学和口语泰米尔语的平行文本,句子来源于维基百科。更多详细信息请参见论文。



