CJaFr-v3
收藏arXiv2022-08-28 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2208.13170v1
下载链接
链接失效反馈官方服务:
资源简介:
CJaFr-v3是一个免费提供的日法双语对齐语料库,包含1500万个对齐段落,由多个现有资源编译和过滤而成。该数据集涵盖了多种文本类型,如演讲、法律文本和百科全书式内容,旨在通过提供高质量的双语材料,促进日法语言对的翻译和分析研究。数据集的创建过程涉及对原始资源的筛选和处理,以确保内容的质量和适用性。CJaFr-v3的应用领域主要集中在机器翻译和语言分析,旨在解决日法语言对资源稀缺的问题。
提供机构:
法国国家科学研究中心-亚洲语言研究所
创建时间:
2022-08-28



