juancavallotti/multilingual-gec

Name: juancavallotti/multilingual-gec
Creator: juancavallotti
Published: 2023-01-06 18:59:59
License: 暂无描述

Hugging Face2023-01-06 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/juancavallotti/multilingual-gec

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集可用于训练Transformer模型（如T5）来纠正英语、西班牙语、法语和德语的简单句子中的语法错误。数据集通过代码生成，并基于互联网上常见的语法错误信息。数据集包含每种语言的句子实例，并提供了语言、原始句子、修改后的句子、主要和次要转换等数据字段。

提供机构：

juancavallotti

原始信息汇总

数据实例:
- 德语: 32282句
- 英语: 51393句
- 西班牙语: 67672句
- 法语: 67157句
数据字段:
- lang: 句子语言
- sentence: 原始句子
- modified: 错误句子
- transformation: 主要转换
- sec_transformation: 次要转换（如有）

5,000+

优质数据集

54 个

任务类型

进入经典数据集