five

中文文本纠错数据集

收藏
魔搭社区2026-01-09 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/Weaxrcks/csc
下载链接
链接失效反馈
官方服务:
资源简介:
中文文本拼写+语法纠错。包含120W+样例,收集自NLPCC、CGED、ECSpell、SIGHAN等等。

This is a Chinese text spelling and grammar correction dataset. It contains over 1.2 million samples collected from NLPCC, CGED, ECSpell, SIGHAN and other relevant sources.
提供机构:
maas
创建时间:
2023-12-29
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个中文拼写纠错数据集,包含约120万条数据,用于检测和纠正中文文本中的错误字符。其数据来源于多个公开的纠错数据集,如SIGHAN+Wang271K、ECSpell、CGED和NLPCC等。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务