nayohan/025_daily_translation
收藏Hugging Face2024-05-13 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/nayohan/025_daily_translation
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个韩语到英语的日常口语翻译平行语料库,包含2,700,345个样本。数据集的特征字段包括domain、subdomain、style、source、target、source_text、target_mt和target_text。数据集分为一个训练集,文件大小为693,174,032字节,下载大小为333,465,860字节。
该数据集是一个韩语到英语的日常口语翻译平行语料库,包含2,700,345个样本。数据集的特征字段包括domain、subdomain、style、source、target、source_text、target_mt和target_text。数据集分为一个训练集,文件大小为693,174,032字节,下载大小为333,465,860字节。
提供机构:
nayohan
原始信息汇总
数据集概述
数据集特征
- domain: 字符串类型
- subdomain: 字符串类型
- style: 字符串类型
- source: 字符串类型
- target: 字符串类型
- source_text: 字符串类型
- target_mt: 字符串类型
- target_text: 字符串类型
数据集分割
- 训练集:
- 字节数: 693174032
- 示例数: 2700345
数据集大小
- 下载大小: 333465860
- 数据集大小: 693174032
配置
- 默认配置:
- 数据文件路径:
data/train-*
- 数据文件路径:



