文本纠错
收藏魔搭社区2025-11-06 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/lwinq1234/text_error_correction
下载链接
链接失效反馈官方服务:
资源简介:
tasks:
- text-error-correction
widgets:
- task: text-error-correction
inputs:
- type: text #可选值:text|image|video|audio
name:
title:
validator:
max_words: 100
examples:
- name: 1
title: 示例1 #用于前端显示,如果不写会使用name来显示
inputs:
- name:
data: 这洋的话,下一年的福气来到自己身上。
- name: 2
title: 示例2 #用于前端显示,如果不写会使用name来显示
inputs:
- name:
data: 在拥挤时间,为了让人们尊守交通规律,派至少两个警察或者交通管理者。
- name: 3
title: 示例3 #用于前端显示,如果不写会使用name来显示
inputs:
- name:
data: 因为世界的多元化,不时会引起人们产生了兴趣。
inferencespec:
cpu: 2 #CPU数量
memory: 4000 #单位MB
gpu: 1 #GPU数量
gpu_memory: 16000 #单位MB
model-type:
- seq2seq(BART)
domain:
- nlp
frameworks:
- pytorch
backbone:
- transformer
containers:
metrics:
- M2Scorer P/R/F0.5
license: Apache License 2.0
language:
- ch
tags:
- transformer
- Alibaba
- text-error-correction
datasets:
train:
- Lang8
- HSK
test:
- NLPCC18 testset
任务:文本错误校正(text-error-correction)
组件配置:
- 任务:文本错误校正(text-error-correction)
输入项:
- 类型:文本(可选值:text|image|video|audio)
名称:无
标题:无
验证器:
最大词数:100
示例:
- 名称:1
标题:示例1(用于前端展示,若未填写则以名称作为展示内容)
输入项:
- 名称:无
数据:这洋的话,下一年的福气来到自己身上。
- 名称:2
标题:示例2(用于前端展示,若未填写则以名称作为展示内容)
输入项:
- 名称:无
数据:在拥挤时间,为了让人们尊守交通规律,派至少两个警察或者交通管理者。
- 名称:3
标题:示例3(用于前端展示,若未填写则以名称作为展示内容)
输入项:
- 名称:无
数据:因为世界的多元化,不时会引起人们产生了兴趣。
推理规格:
CPU核心数:2
内存:4000 MB
GPU数量:1
GPU显存:16000 MB
模型类型:序列到序列(seq2seq)模型(BART)
领域:自然语言处理(NLP)
框架:PyTorch
骨干网络:Transformer
容器:无
评价指标:M2Scorer 精确率(P)、召回率(R)、F0.5值
开源许可证:Apache License 2.0
语言:中文(ch)
标签:Transformer、阿里巴巴(Alibaba)、文本错误校正(text-error-correction)
数据集:
训练集:
- Lang8
- HSK
测试集:
- NLPCC18测试集(NLPCC18 testset)
提供机构:
maas
创建时间:
2023-11-20
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集专注于中文文本错误纠正任务,基于transformer架构(如BART)构建,使用Lang8和HSK作为训练数据,并以NLPCC18测试集进行评估。它采用Apache License 2.0许可,并利用M2Scorer P/R/F0.5指标衡量性能。
以上内容由遇见数据集搜集并总结生成



