five

智译— —多语种平行语料库数据

收藏
深圳市数据知识产权登记系统2024-09-20 更新2024-09-20 收录
下载链接:
https://sjdj.sist.org.cn/cqdjCms/detail/certdetail.html?id=9385109d-99d7-4240-8bb4-05a245910819
下载链接
链接失效反馈
官方服务:
资源简介:
医学领域翻译领域: 为医学翻译提供了丰富的专业术语和历史译文,这些是医学翻译人员在翻译医学文献、病例报告、药品说明书等专业文本时的重要资源。该数据库的应用确保了术语的一致性和准确性,提高了翻译质量,降低了医疗误解和风险。同时,它也是训练医学领域机器翻译模型的宝贵数据,有助于提升翻译的自动化和准确性。 工程领域翻译领域: 解决工程图纸、技术规范、操作手册等文档的多语种翻译问题。它提供的精确专业术语对应和上下文理解能力,确保翻译的准确性,避免因语言障碍造成的工程延误和误解,对跨国工程项目的顺利实施至关重要。 法律专利翻译领域: 确保法律文件、专利申请、合同协议等文档的精确翻译。它通过提供专业术语库和翻译记忆库,帮助法律专业人士准确理解和使用法律术语,保护企业的知识产权。此外,该数据库也是训练法律领域机器翻译模型的重要数据源,提高翻译的自动化水平,降低成本。 军事安全翻译领域: 对于翻译军事情报、安全报告、战略文件等等敏感信息至关重要。它提供的高保密性语言资产库确保了信息的准确传递和安全。这些语言资产不仅支持人工翻译,也可以用于训练机器翻译模型,以满足大量数据快速翻译的需求。
提供机构:
新译信息科技(深圳)有限公司
创建时间:
2024-09-20
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个多语种平行语料库,专注于日语、韩语、葡萄牙语与中文之间的互译,覆盖医学、工程、法律专利和军事安全等专业领域。它提供标准级到专家级的语料数据,经过降噪、去重和正确性校验处理,旨在提升翻译准确性和一致性,支持人工翻译和机器翻译模型训练。数据集已通过深圳市数据知识产权登记,适用于跨语言应用场景,如文档翻译和自动化语言处理。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务