zetavg/coct-en-zh-tw-translations-twp-300k
收藏Hugging Face2023-05-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/zetavg/coct-en-zh-tw-translations-twp-300k
下载链接
链接失效反馈官方服务:
资源简介:
约30万条英汉互译句子,来源于台湾当代汉语语料库(COCT),主要由台湾画报杂志贡献。
提供机构:
zetavg
原始信息汇总
数据集概述
数据集基本信息
- 名称: ~300K English ↔ Traditional Chinese Sentences from the COCT Database
- 任务类别:
- 翻译
- 文本生成
- 语言:
- 中文(zh)
- 英文(en)
- 大小类别: 100K<n<1M
数据集特征
- 特征名称及类型:
en: 字符串类型ch: 字符串类型
数据集分割
- 训练集:
- 样本数量: 310916
- 数据大小: 103139635字节
数据集大小
- 下载大小: 75689895字节
- 数据集总大小: 103139635字节



