five

文本纠错

收藏
魔搭社区2025-11-06 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/lwinq1234/text_error_correction
下载链接
链接失效反馈
官方服务:
资源简介:
tasks: - text-error-correction widgets: - task: text-error-correction inputs: - type: text #可选值:text|image|video|audio name: title: validator: max_words: 100 examples: - name: 1 title: 示例1 #用于前端显示,如果不写会使用name来显示 inputs: - name: data: 这洋的话,下一年的福气来到自己身上。 - name: 2 title: 示例2 #用于前端显示,如果不写会使用name来显示 inputs: - name: data: 在拥挤时间,为了让人们尊守交通规律,派至少两个警察或者交通管理者。 - name: 3 title: 示例3 #用于前端显示,如果不写会使用name来显示 inputs: - name: data: 因为世界的多元化,不时会引起人们产生了兴趣。 inferencespec: cpu: 2 #CPU数量 memory: 4000 #单位MB gpu: 1 #GPU数量 gpu_memory: 16000 #单位MB model-type: - seq2seq(BART) domain: - nlp frameworks: - pytorch backbone: - transformer containers: metrics: - M2Scorer P/R/F0.5 license: Apache License 2.0 language: - ch tags: - transformer - Alibaba - text-error-correction datasets: train: - Lang8 - HSK test: - NLPCC18 testset

任务:文本错误校正(text-error-correction) 组件配置: - 任务:文本错误校正(text-error-correction) 输入项: - 类型:文本(可选值:text|image|video|audio) 名称:无 标题:无 验证器: 最大词数:100 示例: - 名称:1 标题:示例1(用于前端展示,若未填写则以名称作为展示内容) 输入项: - 名称:无 数据:这洋的话,下一年的福气来到自己身上。 - 名称:2 标题:示例2(用于前端展示,若未填写则以名称作为展示内容) 输入项: - 名称:无 数据:在拥挤时间,为了让人们尊守交通规律,派至少两个警察或者交通管理者。 - 名称:3 标题:示例3(用于前端展示,若未填写则以名称作为展示内容) 输入项: - 名称:无 数据:因为世界的多元化,不时会引起人们产生了兴趣。 推理规格: CPU核心数:2 内存:4000 MB GPU数量:1 GPU显存:16000 MB 模型类型:序列到序列(seq2seq)模型(BART) 领域:自然语言处理(NLP) 框架:PyTorch 骨干网络:Transformer 容器:无 评价指标:M2Scorer 精确率(P)、召回率(R)、F0.5值 开源许可证:Apache License 2.0 语言:中文(ch) 标签:Transformer、阿里巴巴(Alibaba)、文本错误校正(text-error-correction) 数据集: 训练集: - Lang8 - HSK 测试集: - NLPCC18测试集(NLPCC18 testset)
提供机构:
maas
创建时间:
2023-11-20
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集专注于中文文本错误纠正任务,基于transformer架构(如BART)构建,使用Lang8和HSK作为训练数据,并以NLPCC18测试集进行评估。它采用Apache License 2.0许可,并利用M2Scorer P/R/F0.5指标衡量性能。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作