five

FCGEC 中文语法检错纠错数据集

收藏
超神经2023-12-27 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/28512
下载链接
链接失效反馈
官方服务:
资源简介:
FCGEC 全称 Fine-Grained Corpus for Chinese Grammatical Error Correction,是一个大规模母语使用者的多参考文本纠检错语料, 用于训练以及评估纠检错模型系统,数据来源主要是小初高中学生的病句试题以及新闻聚合网站。

FCGEC, whose full name is Fine-Grained Corpus for Chinese Grammatical Error Correction, is a large-scale multi-reference corpus for Chinese grammatical error detection and correction, with its texts mainly produced by native speakers. It is developed for training and evaluating grammatical error detection and correction models, and its data is primarily sourced from sentence error test questions of primary, middle and high school students as well as news aggregation websites.
创建时间:
2023-12-19
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
FCGEC 是一个用于中文语法检错与纠错的大规模多参考语料库,数据主要来源于学生病句试题和新闻网站,每个句子由2-4名标注者标注以提高多样性。该数据集包含41,340个经过筛选的句子,适用于训练和评估纠检错模型系统。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务