0x22almostEvil/tatoeba-mt-all-in-one
收藏Hugging Face2023-05-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/0x22almostEvil/tatoeba-mt-all-in-one
下载链接
链接失效反馈官方服务:
资源简介:
Tatoeba翻译挑战赛 | 一体化版本数据集,包含约730万条条目,是一个用户友好版本,将所有原始数据集的条目合并到一个文件中。该数据集支持多种语言,包括但不限于英语、中文、法语、德语等,主要用于翻译任务。
Tatoeba翻译挑战赛 | 一体化版本数据集,包含约730万条条目,是一个用户友好版本,将所有原始数据集的条目合并到一个文件中。该数据集支持多种语言,包括但不限于英语、中文、法语、德语等,主要用于翻译任务。
提供机构:
0x22almostEvil
原始信息汇总
数据集概述
数据集名称
- 名称: The Tatoeba Translation Challenge | All In One
数据集创建者
- 标注创建者: Helsinki-NLP
语言信息
- 支持语言:
- af, ar, az, be, bg, bn, br, bs, ca, ch, cs, cv, cy, da, de, el, en, eo, es, et, eu, fa, fi, fo, fr, fy, ga, gd, gl, gn, he, hi, hr, hu, hy, ia, id, ie, io, is, it, ja, jv, ka, kk, km, ko, ku, kw, la, lb, lt, lv, mi, mk, ml, mn, mr, ms, mt, my, nb, nl, nn, no, oc, pl, pt, qu, rn, ro, ru, sh, sl, sq, sr, sv, sw, ta, te, th, tk, tl, tr, tt, ug, uk, ur, uz, vi, vo, yi, zh
许可证
- 许可证: cc-by-2.0
多语言性
- 多语言类型: 翻译
数据集大小
- 大小: 1M<n<10M
源数据集
- 源数据集: Helsinki-NLP/tatoeba_mt



