ParCorFull (Parallel Corpus Annotated with Full Coreference)
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/ParCorFull
下载链接
链接失效反馈官方服务:
资源简介:
ParCorFull 是一个用完整的共指链注释的并行语料库,它的创建是为了解决机器翻译和其他多语言自然语言处理 (NLP) 技术面临的一个重要问题——跨语言的共指翻译。该语料库包含语言对英语-德语(两种主要的欧洲语言)的平行文本。尽管在类型上非常接近,但这些语言在共指的实现上仍然存在系统性差异,从而给多语言共指解析和机器翻译带来了问题。这个平行语料库涵盖了计划演讲(公开讲座)和新闻专线的类型。它对两种语言的共指进行了丰富的注释,包括对名词性共指和对以从句、句子和动词短语表示的先行词的注释。
提供机构:
OpenDataLab
创建时间:
2022-05-24
搜集汇总
数据集介绍

背景与挑战
背景概述
ParCorFull是一个用完整共指链注释的英语-德语平行语料库,旨在解决机器翻译和多语言NLP中的跨语言共指问题。它覆盖演讲和新闻类型,对名词性共指及从句、句子、动词短语表示的先行词进行了丰富注释。
以上内容由遇见数据集搜集并总结生成



