five

wi_locness

收藏
Opencsg2024-07-19 更新2025-05-03 收录
下载链接:
https://www.opencsg.com/datasets/AIWizards/wi_locness
下载链接
链接失效反馈
官方服务:
资源简介:
Cambridge English Write & Improve + LOCNESS 提供英文文本数据,规模在1K到10K之间,包含母语和非母语英语学习者的作文。数据集中包含文本的CEFR等级信息,并由专家生成了语法错误标注,标注信息包括错误的起始位置、结束位置以及修改后的文本。此数据集主要用于语法纠错任务,旨在帮助语言学习者提高写作技能,也可用于提醒母语使用者注意意外错误。数据集遵循特定的许可协议,包括Write & Improve License和LOCNESS License,限制了商业用途和数据再分发。

Cambridge English Write & Improve and LOCNESS offer English textual data, with the dataset size ranging from 1,000 to 10,000 instances. The dataset contains essays written by both native and non-native English learners, and includes CEFR level information for each text. It features grammatical error annotations generated by experts, which cover the start and end positions of errors as well as the corrected text. This dataset is primarily used for grammatical error correction tasks, aiming to help language learners improve their writing skills, and can also be used to remind native English speakers of accidental grammatical errors. The dataset is subject to specific license agreements including the Write & Improve License and the LOCNESS License, which restrict commercial use and data redistribution.
创建时间:
2024-07-19
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
wi_locness数据集是一个包含1K到10K规模英文文本的数据集,涵盖母语和非母语英语学习者的作文,附带CEFR等级和专家标注的语法错误信息,主要用于语法纠错任务,遵循非商业用途的许可协议。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作