five

0x22almostEvil/tatoeba-mt-all-in-one

收藏
Hugging Face2023-05-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/0x22almostEvil/tatoeba-mt-all-in-one
下载链接
链接失效反馈
官方服务:
资源简介:
Tatoeba翻译挑战赛 | 一体化版本数据集,包含约730万条条目,是一个用户友好版本,将所有原始数据集的条目合并到一个文件中。该数据集支持多种语言,包括但不限于英语、中文、法语、德语等,主要用于翻译任务。

Tatoeba翻译挑战赛 | 一体化版本数据集,包含约730万条条目,是一个用户友好版本,将所有原始数据集的条目合并到一个文件中。该数据集支持多种语言,包括但不限于英语、中文、法语、德语等,主要用于翻译任务。
提供机构:
0x22almostEvil
原始信息汇总

数据集概述

数据集名称

  • 名称: The Tatoeba Translation Challenge | All In One

数据集创建者

  • 标注创建者: Helsinki-NLP

语言信息

  • 支持语言:
    • af, ar, az, be, bg, bn, br, bs, ca, ch, cs, cv, cy, da, de, el, en, eo, es, et, eu, fa, fi, fo, fr, fy, ga, gd, gl, gn, he, hi, hr, hu, hy, ia, id, ie, io, is, it, ja, jv, ka, kk, km, ko, ku, kw, la, lb, lt, lv, mi, mk, ml, mn, mr, ms, mt, my, nb, nl, nn, no, oc, pl, pt, qu, rn, ro, ru, sh, sl, sq, sr, sv, sw, ta, te, th, tk, tl, tr, tt, ug, uk, ur, uz, vi, vo, yi, zh

许可证

  • 许可证: cc-by-2.0

多语言性

  • 多语言类型: 翻译

数据集大小

  • 大小: 1M<n<10M

源数据集

  • 源数据集: Helsinki-NLP/tatoeba_mt
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作