UA-GEC (UA-GEC: Grammatical Error Correction and Fluency Corpus for the Ukrainian Language)
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/UA-GEC
下载链接
链接失效反馈官方服务:
资源简介:
语法错误纠正 (GEC) 是纠正文本中不同类型错误的任务,例如拼写、标点符号、语法和单词选择错误。我们提供了一个专业注释的语料库,用于语法错误纠正 (GEC) 和流畅的编辑乌克兰语。据我们所知,这是乌克兰语的第一个 GEC 语料库。我们从包括母语和非母语人士在内的不同贡献者中收集了有错误的文本(20,715 个句子)。这些数据涵盖了广泛的写作领域,从文本聊天和论文到正式写作。专业校对人员纠正和注释与流利度、语法、标点和拼写有关的错误。该语料库可用于开发和评估乌克兰语的 GEC 系统。更一般地说,它可用于研究多语言和低资源 NLP、形态丰富的语言、文档级 GEC 和流畅性校正。
提供机构:
OpenDataLab
创建时间:
2022-05-09



