Deysi/spanish-chinese
收藏Hugging Face2023-03-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Deysi/spanish-chinese
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含从联合国平行语料库v1.0中提取的西班牙语和中文对齐句子。平行语料库由六种联合国官方语言(阿拉伯语、中文、英语、法语、俄语和西班牙语)的手动翻译文档组成。这些文档可从联合国官方文件系统(ODS)获取,并且语料库在特定使用条款下可免费下载。
该数据集包含从联合国平行语料库v1.0中提取的西班牙语和中文对齐句子。平行语料库由六种联合国官方语言(阿拉伯语、中文、英语、法语、俄语和西班牙语)的手动翻译文档组成。这些文档可从联合国官方文件系统(ODS)获取,并且语料库在特定使用条款下可免费下载。
提供机构:
Deysi
原始信息汇总
数据集概述
基本信息
- 名称: Spanish and Chinese aligned sentences
- 许可证: Apache-2.0
- 任务类别: 翻译
- 语言: 西班牙语, 中文
- 标签: 语言, 翻译, traducción, idiomas, 中文, 西班牙语
- 大小类别: 10M<n<100M
数据集结构
- 特征:
spanish: 字符串类型chinese: 字符串类型
数据分割
- 训练集:
- 样本数: 9092567
- 数据大小: 3048111118.5537825字节
- 测试集:
- 样本数: 2273142
- 数据大小: 762027863.4462174字节
数据集大小
- 下载大小: 2473454462字节
- 数据集总大小: 3810138982字节



