wecover/OPUS_Tatoeba
收藏数据集配置
该数据集包含多个配置,每个配置对应不同的语言和数据文件路径。以下是各配置的详细信息:
默认配置
- 配置名称: default
- 数据文件:
- 训练集:
*/*/train.parquet - 验证集:
*/*/valid.parquet
- 训练集:
语言配置
-
配置名称: af
-
数据文件:
- 训练集:
*/*af*/train.parquet - 验证集:
*/*af*/valid.parquet
- 训练集:
-
配置名称: ar
-
数据文件:
- 训练集:
*/*ar*/train.parquet - 验证集:
*/*ar*/valid.parquet
- 训练集:
-
配置名称: ca
-
数据文件:
- 训练集:
*/*ca*/train.parquet - 验证集:
*/*ca*/valid.parquet
- 训练集:
-
配置名称: cs
-
数据文件:
- 训练集:
*/*cs*/train.parquet - 验证集:
*/*cs*/valid.parquet
- 训练集:
-
配置名称: de
-
数据文件:
- 训练集:
*/*de*/train.parquet - 验证集:
*/*de*/valid.parquet
- 训练集:
-
配置名称: en
-
数据文件:
- 训练集:
*/*en*/train.parquet - 验证集:
*/*en*/valid.parquet
- 训练集:
-
配置名称: eo
-
数据文件:
- 训练集:
*/*eo*/train.parquet - 验证集:
*/*eo*/valid.parquet
- 训练集:
-
配置名称: es
-
数据文件:
- 训练集:
*/*es*/train.parquet - 验证集:
*/*es*/valid.parquet
- 训练集:
-
配置名称: fi
-
数据文件:
- 训练集:
*/*fi*/train.parquet - 验证集:
*/*fi*/valid.parquet
- 训练集:
-
配置名称: fr
-
数据文件:
- 训练集:
*/*fr*/train.parquet - 验证集:
*/*fr*/valid.parquet
- 训练集:
-
配置名称: ga
-
数据文件:
- 训练集:
*/*ga*/train.parquet - 验证集:
*/*ga*/valid.parquet
- 训练集:
-
配置名称: it
-
数据文件:
- 训练集:
*/*it*/train.parquet - 验证集:
*/*it*/valid.parquet
- 训练集:
-
配置名称: ja
-
数据文件:
- 训练集:
*/*ja*/train.parquet - 验证集:
*/*ja*/valid.parquet
- 训练集:
-
配置名称: la
-
数据文件:
- 训练集:
*/*la*/train.parquet - 验证集:
*/*la*/valid.parquet
- 训练集:
-
配置名称: nl
-
数据文件:
- 训练集:
*/*nl*/train.parquet - 验证集:
*/*nl*/valid.parquet
- 训练集:
-
配置名称: pl
-
数据文件:
- 训练集:
*/*pl*/train.parquet - 验证集:
*/*pl*/valid.parquet
- 训练集:
-
配置名称: pt
-
数据文件:
- 训练集:
*/*pt*/train.parquet - 验证集:
*/*pt*/valid.parquet
- 训练集:
-
配置名称: ro
-
数据文件:
- 训练集:
*/*ro*/train.parquet - 验证集:
*/*ro*/valid.parquet
- 训练集:
-
配置名称: ru
-
数据文件:
- 训练集:
*/*ru*/train.parquet - 验证集:
*/*ru*/valid.parquet
- 训练集:
-
配置名称: sv
-
数据文件:
- 训练集:
*/*sv*/train.parquet - 验证集:
*/*sv*/valid.parquet
- 训练集:
-
配置名称: tr
-
数据文件:
- 训练集:
*/*tr*/train.parquet - 验证集:
*/*tr*/valid.parquet
- 训练集:
-
配置名称: uk
-
数据文件:
- 训练集:
*/*uk*/train.parquet - 验证集:
*/*uk*/valid.parquet
- 训练集:
-
配置名称: xh
-
数据文件:
- 训练集:
*/*xh*/train.parquet - 验证集:
*/*xh*/valid.parquet
- 训练集:
-
配置名称: yi
-
数据文件:
- 训练集:
*/*yi*/train.parquet - 验证集:
*/*yi*/valid.parquet
- 训练集:
-
配置名称: am
-
数据文件:
- 训练集:
*/*am*/train.parquet - 验证集:
*/*am*/valid.parquet
- 训练集:
-
配置名称: bg
-
数据文件:
- 训练集:
*/*bg*/train.parquet - 验证集:
*/*bg*/valid.parquet
- 训练集:
-
配置名称: da
-
数据文件:
- 训练集:
*/*da*/train.parquet - 验证集:
*/*da*/valid.parquet
- 训练集:
-
配置名称: el
-
数据文件:
- 训练集:
*/*el*/train.parquet - 验证集:
*/*el*/valid.parquet
- 训练集:
-
配置名称: he
-
数据文件:
- 训练集:
*/*he*/train.parquet - 验证集:
*/*he*/valid.parquet
- 训练集:
-
配置名称: hu
-
数据文件:
- 训练集:
*/*hu*/train.parquet - 验证集:
*/*hu*/valid.parquet
- 训练集:
-
配置名称: ko
-
数据文件:
- 训练集:
*/*ko*/train.parquet - 验证集:
*/*ko*/valid.parquet
- 训练集:
-
配置名称: ku
-
数据文件:
- 训练集:
*/*ku*/train.parquet - 验证集:
*/*ku*/valid.parquet
- 训练集:
-
配置名称: lt
-
数据文件:
- 训练集:
*/*lt*/train.parquet - 验证集:
*/*lt*/valid.parquet
- 训练集:
-
配置名称: mk
-
数据文件:
- 训练集:
*/*mk*/train.parquet - 验证集:
*/*mk*/valid.parquet
- 训练集:
-
配置名称: ug
-
数据文件:
- 训练集:
*/*ug*/train.parquet - 验证集:
*/*ug*/valid.parquet
- 训练集:
-
配置名称: ur
-
数据文件:
- 训练集:
*/*ur*/train.parquet - 验证集:
*/*ur*/valid.parquet
- 训练集:
-
配置名称: as
-
数据文件:
- 训练集:
*/*as*/train.parquet - 验证集:
*/*as*/valid.parquet
- 训练集:
-
配置名称: bn
-
数据文件:
- 训练集:
*/*bn*/train.parquet - 验证集:
*/*bn*/valid.parquet
- 训练集:
-
配置名称: hi
-
数据文件:
- 训练集:
*/*hi*/train.parquet - 验证集:
*/*hi*/valid.parquet
- 训练集:
-
配置名称: az
-
数据文件:
- 训练集:
*/*az*/train.parquet - 验证集:
*/*az*/valid.parquet
- 训练集:
-
配置名称: kk
-
数据文件:
- 训练集:
*/*kk*/train.parquet - 验证集:
*/*kk*/valid.parquet
- 训练集:
-
配置名称: be
-
数据文件:
- 训练集:
*/*be*/train.parquet - 验证集:
*/*be*/valid.parquet
- 训练集:
-
配置名称: et
-
数据文件:
- 训练集:
*/*et*/train.parquet - 验证集:
*/*et*/valid.parquet
- 训练集:
-
配置名称: sl
-
数据文件:
- 训练集:
*/*sl*/train.parquet - 验证集:
*/*sl*/valid.parquet
- 训练集:
-
配置名称: sr
-
数据文件:
- 训练集:
*/*sr*/train.parquet - 验证集:
*/*sr*/valid.parquet
- 训练集:
-
配置名称: vi
-
数据文件:
- 训练集:
*/*vi*/train.parquet - 验证集:
*/*vi*/valid.parquet
- 训练集:
-
配置名称: id
-
数据文件:
- 训练集:
*/*id*/train.parquet - 验证集:
*/*id*/valid.parquet
- 训练集:
-
配置名称: br
-
数据文件:
- 训练集:
*/*br*/train.parquet - 验证集:
*/*br*/valid.parquet
- 训练集:
-
配置名称: bs
-
数据文件:
- 训练集:
*/*bs*/train.parquet - 验证集:
*/*bs*/valid.parquet
- 训练集:
-
配置名称: hr
-
数据文件:
- 训练集:
*/*hr*/train.parquet - 验证集:
*/*hr*/valid.parquet
- 训练集:
-
配置名称: gl
-
数据文件:
- 训练集:
*/*gl*/train.parquet - 验证集:
*/*gl*/valid.parquet
- 训练集:
-
配置名称: fy
-
数据文件:
- 训练集:
*/*fy*/train.parquet - 验证集:
*/*fy*/valid.parquet
- 训练集:
-
配置名称: ka
-
数据文件:
- 训练集:
*/*ka*/train.parquet - 验证集:
*/*ka*/valid.parquet
- 训练集:
-
配置名称: tl
-
数据文件:
- 训练集:
*/*tl*/train.parquet - 验证集:
*/*tl*/valid.parquet
- 训练集:
-
配置名称: cy
-
数据文件:
- 训练集:
*/*cy*/train.parquet - 验证集:
*/*cy*/valid.parquet
- 训练集:
-
配置名称: is
-
数据文件:
- 训练集:
*/*is*/train.parquet - 验证集:
*/*is*/valid.parquet
- 训练集:
-
配置名称: eu
-
数据文件:
- 训练集:
*/*eu*/train.parquet - 验证集:
*/*eu*/valid.parquet
- 训练集:
-
配置名称: gd
-
数据文件:
- 训练集:
*/*gd*/train.parquet - 验证集:
*/*gd*/valid.parquet
- 训练集:
-
配置名称: ha
-
数据文件:
- 训练集:
*/*ha*/train.parquet - 验证集:
*/*ha*/valid.parquet
- 训练集:
-
配置名称: hy
-
数据文件:
- 训练集:
*/*hy*/train.parquet - 验证集:
*/*hy*/valid.parquet
- 训练集:
-
配置名称: km
-
数据文件:
- 训练集:
*/*km*/train.parquet - 验证集:
*/*km*/valid.parquet
- 训练集:
-
配置名称: ky
-
数据文件:
- 训练集:
*/*ky*/train.parquet - 验证集:
*/*ky*/valid.parquet
- 训练集:
-
配置名称: mn
-
数据文件:
- 训练集:
*/*mn*/train.parquet - 验证集:
*/*mn*/valid.parquet
- 训练集:
-
配置名称: mr
-
数据文件:
- 训练集:
*/*mr*/train.parquet - 验证集:
*/*mr*/valid.parquet
- 训练集:
-
配置名称: my
-
数据文件:
- 训练集:
*/*my*/train.parquet - 验证集:
*/*my*/valid.parquet
- 训练集:
-
配置名称: th
-
数据文件:
- 训练集:
*/*th*/train.parquet - 验证集:
*/*th*/valid.parquet
- 训练集:
-
配置名称: uz
-
数据文件:
- 训练集:
*/*uz*/train.parquet - 验证集:
*/*uz*/valid.parquet
- 训练集:
-
配置名称: jv
-
数据文件:
- 训练集:
*/*jv*/train.parquet - 验证集:
*/*jv*/valid.parquet
- 训练集:
-
配置名称: kn
-
数据文件:
- 训练集:
*/*kn*/train.parquet - 验证集:
*/*kn*/valid.parquet
- 训练集:
-
配置名称: lo
-
数据文件:
- 训练集:
*/*lo*/train.parquet - 验证集:
*/*lo*/valid.parquet
- 训练集:
-
配置名称: mg
-
数据文件:
- 训练集:
*/*mg*/train.parquet - 验证集:
*/*mg*/valid.parquet
- 训练集:
-
配置名称: ml
-
数据文件:
- 训练集:
*/*ml*/train.parquet - 验证集:
*/*ml*/valid.parquet
- 训练集:
-
配置名称: or
-
数据文件:
- 训练集:
*/*or*/train.parquet - 验证集:
*/*or*/valid.parquet
- 训练集:
-
配置名称: pa
-
数据文件:
- 训练集:
*/*pa*/train.parquet - 验证集:
*/*pa*/valid.parquet
- 训练集:
-
配置名称: ps
-
数据文件:
- 训练集:
*/*ps*/train.parquet - 验证集:
*/*ps*/valid.parquet
- 训练集:
-
配置名称: sa
-
数据文件:
- 训练集:
*/*sa*/train.parquet - 验证集:
*/*sa*/valid.parquet
- 训练集:
-
配置名称: sd
-
数据文件:
- 训练集:
*/*sd*/train.parquet
- 训练集:
-
配置名称: si
-
数据文件:
- 训练集:
*/*si*/train.parquet - 验证集:
*/*si*/valid.parquet
- 训练集:
-
配置名称: so
-
数据文件:
- 训练集:
*/*so*/train.parquet - 验证集:
*/*so*/valid.parquet
- 训练集:
-
配置名称: sq
-
数据文件:
- 训练集:
*/*sq*/train.parquet - 验证集:
*/*sq*/valid.parquet
- 训练集:
-
配置名称: su
-
数据文件:
- 训练集:
*/*su*/train.parquet - 验证集:
*/*su*/valid.parquet
- 训练集:
-
配置名称: ta
-
数据文件:
- 训练集:
*/*ta*/train.parquet - 验证集:
*/*ta*/valid.parquet
- 训练集:
-
配置名称: te
-
数据文件:
- 训练集:
*/*te*/train.parquet - 验证集:
*/*te*/valid.parquet
- 训练集:



