five

zetavg/coct-en-zh-tw-translations-twp-300k

收藏
Hugging Face2023-05-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/zetavg/coct-en-zh-tw-translations-twp-300k
下载链接
链接失效反馈
官方服务:
资源简介:
约30万条英汉互译句子,来源于台湾当代汉语语料库(COCT),主要由台湾画报杂志贡献。
提供机构:
zetavg
原始信息汇总

数据集概述

数据集基本信息

  • 名称: ~300K English ↔ Traditional Chinese Sentences from the COCT Database
  • 任务类别:
    • 翻译
    • 文本生成
  • 语言:
    • 中文(zh)
    • 英文(en)
  • 大小类别: 100K<n<1M

数据集特征

  • 特征名称及类型:
    • en: 字符串类型
    • ch: 字符串类型

数据集分割

  • 训练集:
    • 样本数量: 310916
    • 数据大小: 103139635字节

数据集大小

  • 下载大小: 75689895字节
  • 数据集总大小: 103139635字节
二维码
社区交流群
二维码
科研交流群
商业服务