Deepakvictor/tan-tam
收藏Hugging Face2023-08-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Deepakvictor/tan-tam
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含从Tanglish(泰米尔语和英语的混合语言)到泰米尔语的翻译数据,数据来源为karky.in。数据集规模在1K到10K之间,涉及的任务类别包括翻译和文本分类,使用的语言为泰米尔语和英语。
提供机构:
Deepakvictor
原始信息汇总
数据集概述
基本信息
- 许可证: openrail
- 任务类别:
- 翻译
- 文本分类
- 语言:
- 泰米尔语 (ta)
- 英语 (en)
- 数据集名称: translation
- 数据规模: 1K<n<10K
详细描述
- 数据集加载: python import datasets s = datasets.load_dataset(Deepakvictor/tan-tam) print(s) """ DatasetDict({ train: Dataset({ features: [en, ta], num_rows: 22114 }) }) """
来源
- 数据来源: karky.in
其他版本
- 复杂版本: Deepakvictor/tanglish-tamil



