five

Lynxpda/back-translated-veps-russian

收藏
Hugging Face2024-05-29 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Lynxpda/back-translated-veps-russian
下载链接
链接失效反馈
官方服务:
资源简介:
Vepsian - Russian数据集包含Vepsian语言的原始句子,并通过Lynxpda/vep_ru模型进行了反向翻译成俄语。数据来源包括Vepsian WiKi、Lehme No 2051 // Open corpus of Vepsian and Karelian languages VepKar以及OMAMEDIA。数据集的特征包括vep和ru两个字段,分别表示Vepsian和俄语的句子。数据集分为一个训练集,包含124,771个例子,总大小为31,389,135字节。数据集的下载大小为19,744,168字节。数据集的许可证为cc-by-sa-4.0,支持的语言为Vepsian和俄语,任务类别为翻译。

Vepsian - Russian数据集包含Vepsian语言的原始句子,并通过Lynxpda/vep_ru模型进行了反向翻译成俄语。数据来源包括Vepsian WiKi、Lehme No 2051 // Open corpus of Vepsian and Karelian languages VepKar以及OMAMEDIA。数据集的特征包括vep和ru两个字段,分别表示Vepsian和俄语的句子。数据集分为一个训练集,包含124,771个例子,总大小为31,389,135字节。数据集的下载大小为19,744,168字节。数据集的许可证为cc-by-sa-4.0,支持的语言为Vepsian和俄语,任务类别为翻译。
提供机构:
Lynxpda
原始信息汇总

数据集概述

数据集信息

  • 名称: Vepsian - Russian
  • 语言:
    • Vepsian (vep)
    • Russian (ru)
  • 任务类别: Translation
  • 许可证: cc-by-sa-4.0

数据集特征

  • 特征名称与数据类型:
    • vep: string
    • ru: string

数据集划分

  • 训练集:
    • 文件大小: 31,389,135 bytes
    • 示例数量: 124,771
    • 下载大小: 19,744,168 bytes

配置

  • 默认配置:
    • 数据文件路径: data/train-*

数据来源

  • Vepsian Wiki
  • Lehme No 2051 // Open corpus of Vepsian and Karelian languages VepKar.
  • OMAMEDIA
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作