five

miugod/ikcest2022

收藏
Hugging Face2024-04-22 更新2024-04-19 收录
下载链接:
https://hf-mirror.com/datasets/miugod/ikcest2022
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个多语言翻译数据集,主要涉及中文(zh)与其他语言(如英语、法语、俄语、泰语和阿拉伯语)之间的翻译任务。数据集包含多个配置,每个配置对应一种语言对的翻译数据,并且每个配置都包含训练集、测试集和验证集。数据集的规模在10万到100万条之间。
提供机构:
miugod
原始信息汇总

数据集概述

  • 任务类别: 翻译
  • 语言: 中文 (zh), 英文 (en), 法文 (fr), 俄文 (ru), 泰文 (th), 阿拉伯文 (ar)
  • 数据集名称: ikcest2022
  • 数据集大小: 100K<n<1M

数据集配置

  1. 配置名称: ikcest2022-zh-fr

    • 特征: 翻译
      • 语言: 中文 (zh), 法文 (fr)
    • 分割: 训练 (train), 测试 (test), 验证 (validation)
  2. 配置名称: ikcest2022-zh-ru

    • 特征: 翻译
      • 语言: 中文 (zh), 俄文 (ru)
    • 分割: 训练 (train), 测试 (test), 验证 (validation)
  3. 配置名称: ikcest2022-zh-th

    • 特征: 翻译
      • 语言: 中文 (zh), 泰文 (th)
    • 分割: 训练 (train), 测试 (test), 验证 (validation)
  4. 配置名称: ikcest2022-zh-ar

    • 特征: 翻译
      • 语言: 中文 (zh), 阿拉伯文 (ar)
    • 分割: 训练 (train), 测试 (test), 验证 (validation)
  5. 配置名称: ikcest2022-zh-en

    • 特征: 翻译
      • 语言: 中文 (zh), 英文 (en)
    • 分割: 训练 (train), 测试 (test), 验证 (validation)
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作