BVS Corpus
收藏arXiv2019-05-06 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/1905.01712v1
下载链接
链接失效反馈资源简介:
BVS Corpus是一个多语言平行语料库,专注于生物医学科学文本,由联邦里约热内卢大学和巴塞罗那超级计算中心创建。该数据集包含超过170万条记录,涵盖英语、葡萄牙语和西班牙语三种语言。数据集的创建过程涉及自动句子对齐和人工评估,确保高质量的语料对齐。BVS Corpus主要用于神经机器翻译(NMT)系统的训练,旨在提高生物医学领域的文本翻译质量。
提供机构:
联邦里约热内卢大学巴塞罗那超级计算中心
创建时间:
2019-05-06



