five

ParCorFull (Parallel Corpus Annotated with Full Coreference)

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/ParCorFull
下载链接
链接失效反馈
官方服务:
资源简介:
ParCorFull 是一个用完整的共指链注释的并行语料库,它的创建是为了解决机器翻译和其他多语言自然语言处理 (NLP) 技术面临的一个重要问题——跨语言的共指翻译。该语料库包含语言对英语-德语(两种主要的欧洲语言)的平行文本。尽管在类型上非常接近,但这些语言在共指的实现上仍然存在系统性差异,从而给多语言共指解析和机器翻译带来了问题。这个平行语料库涵盖了计划演讲(公开讲座)和新闻专线的类型。它对两种语言的共指进行了丰富的注释,包括对名词性共指和对以从句、句子和动词短语表示的先行词的注释。
提供机构:
OpenDataLab
创建时间:
2022-05-24
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作