ranWang/undl_en2zh_translation
收藏Hugging Face2023-10-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ranWang/undl_en2zh_translation
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为undl_en2zh_translation,主要用于英文到中文的翻译任务。数据集包含四个特征:clean_en(英文文本)、clean_zh(中文文本)、record(记录)和en2zh(英文到中文的翻译)。数据集分为训练集,包含165840个示例,总大小为12473072134字节。下载大小为6289513941字节。
提供机构:
ranWang
原始信息汇总
数据集概述
特征信息
- clean_en: 英文清洗后的文本,类型为字符串序列。
- clean_zh: 中文清洗后的文本,类型为字符串序列。
- record: 记录信息,类型为字符串。
- en2zh: 英译中文本,类型为字符串序列。
数据分割
- train: 训练集,包含165840个样本,总字节数为12473072134。
数据大小
- 下载大小: 6289513941字节。
- 数据集大小: 12473072134字节。



