miugod/ikcest2022
收藏Hugging Face2024-04-22 更新2024-04-19 收录
下载链接:
https://hf-mirror.com/datasets/miugod/ikcest2022
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个多语言翻译数据集,主要涉及中文(zh)与其他语言(如英语、法语、俄语、泰语和阿拉伯语)之间的翻译任务。数据集包含多个配置,每个配置对应一种语言对的翻译数据,并且每个配置都包含训练集、测试集和验证集。数据集的规模在10万到100万条之间。
提供机构:
miugod
原始信息汇总
数据集概述
- 任务类别: 翻译
- 语言: 中文 (zh), 英文 (en), 法文 (fr), 俄文 (ru), 泰文 (th), 阿拉伯文 (ar)
- 数据集名称: ikcest2022
- 数据集大小: 100K<n<1M
数据集配置
-
配置名称: ikcest2022-zh-fr
- 特征: 翻译
- 语言: 中文 (zh), 法文 (fr)
- 分割: 训练 (train), 测试 (test), 验证 (validation)
- 特征: 翻译
-
配置名称: ikcest2022-zh-ru
- 特征: 翻译
- 语言: 中文 (zh), 俄文 (ru)
- 分割: 训练 (train), 测试 (test), 验证 (validation)
- 特征: 翻译
-
配置名称: ikcest2022-zh-th
- 特征: 翻译
- 语言: 中文 (zh), 泰文 (th)
- 分割: 训练 (train), 测试 (test), 验证 (validation)
- 特征: 翻译
-
配置名称: ikcest2022-zh-ar
- 特征: 翻译
- 语言: 中文 (zh), 阿拉伯文 (ar)
- 分割: 训练 (train), 测试 (test), 验证 (validation)
- 特征: 翻译
-
配置名称: ikcest2022-zh-en
- 特征: 翻译
- 语言: 中文 (zh), 英文 (en)
- 分割: 训练 (train), 测试 (test), 验证 (validation)
- 特征: 翻译



