Nexdata/Japanese-English_Parallel_Corpus_Data
收藏Hugging Face2023-11-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/Japanese-English_Parallel_Corpus_Data
下载链接
链接失效反馈官方服务:
资源简介:
日英平行语料库数据集,共包含38万组数据,排除了政治、色情、个人信息等敏感词汇。该数据集可作为文本分析的基础语料库,适用于机器翻译等领域。数据存储格式为TXT,语言为日语和英语,应用场景为机器翻译。数据集采用商业许可。
提供机构:
Nexdata
原始信息汇总
数据集卡片 Nexdata/Japanese-English_Parallel_Corpus_Data
描述
日英平行语料库,总计38万个组;排除了政治、色情、个人信息等敏感词汇;可作为基于文本的数据分析的基础语料库,用于机器翻译等领域。
规范
存储格式
TXT
数据内容
日英平行语料库数据
数据大小
0.38百万对日英平行语料库数据
语言
日语, 英语
应用场景
机器翻译
许可信息
商业许可证



