Lynxpda/back-translated-veps-russian
收藏Hugging Face2024-05-29 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Lynxpda/back-translated-veps-russian
下载链接
链接失效反馈官方服务:
资源简介:
Vepsian - Russian数据集包含Vepsian语言的原始句子,并通过Lynxpda/vep_ru模型进行了反向翻译成俄语。数据来源包括Vepsian WiKi、Lehme No 2051 // Open corpus of Vepsian and Karelian languages VepKar以及OMAMEDIA。数据集的特征包括vep和ru两个字段,分别表示Vepsian和俄语的句子。数据集分为一个训练集,包含124,771个例子,总大小为31,389,135字节。数据集的下载大小为19,744,168字节。数据集的许可证为cc-by-sa-4.0,支持的语言为Vepsian和俄语,任务类别为翻译。
Vepsian - Russian数据集包含Vepsian语言的原始句子,并通过Lynxpda/vep_ru模型进行了反向翻译成俄语。数据来源包括Vepsian WiKi、Lehme No 2051 // Open corpus of Vepsian and Karelian languages VepKar以及OMAMEDIA。数据集的特征包括vep和ru两个字段,分别表示Vepsian和俄语的句子。数据集分为一个训练集,包含124,771个例子,总大小为31,389,135字节。数据集的下载大小为19,744,168字节。数据集的许可证为cc-by-sa-4.0,支持的语言为Vepsian和俄语,任务类别为翻译。
提供机构:
Lynxpda
原始信息汇总
数据集概述
数据集信息
- 名称: Vepsian - Russian
- 语言:
- Vepsian (vep)
- Russian (ru)
- 任务类别: Translation
- 许可证: cc-by-sa-4.0
数据集特征
- 特征名称与数据类型:
- vep: string
- ru: string
数据集划分
- 训练集:
- 文件大小: 31,389,135 bytes
- 示例数量: 124,771
- 下载大小: 19,744,168 bytes
配置
- 默认配置:
- 数据文件路径: data/train-*
数据来源
- Vepsian Wiki
- Lehme No 2051 // Open corpus of Vepsian and Karelian languages VepKar.
- OMAMEDIA



