five

Character Transformations for Non-Autoregressive GEC Tagging

收藏
DataCite Commons2026-01-07 更新2025-04-16 收录
下载链接:
https://service.tib.eu/ldmservice/dataset/0451527d-e439-4630-8ea6-4c807432b075
下载链接
链接失效反馈
官方服务:
资源简介:
Propose character-based method to generate target transformation instructions for GEC tagging models, as an alternative to autoregressive models. Compare character transformations to previously used word-level transformation instructions and have shown that character-based rules have better coverage and scale better in Czech, German and Russian.

本研究提出一种基于字符的方法,用于为语法错误纠正(Grammatical Error Correction)标注模型生成目标转换指令,以此作为自回归模型的替代方案。通过将字符级转换与此前使用的词级转换指令进行对比实验,结果证实,在捷克语、德语与俄语语料中,基于字符的转换规则具备更优的覆盖范围与更强的可扩展性。
提供机构:
TIB
创建时间:
2024-12-16
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作