DECOR
收藏arXiv2024-06-28 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2406.19650v1
下载链接
链接失效反馈官方服务:
资源简介:
DECOR数据集由哥伦比亚大学和加利福尼亚大学戴维斯分校的研究团队创建,专门用于评估和提升第二语言英语写作的连贯性。该数据集包含1,352个上下文-句子对,这些对来自TOEFL-11语料库,并经过专家详细标注以检测不连贯性、识别原因并重写不连贯的句子。数据集的创建过程遵循了Maimon和Tsarfaty(2023)提出的增量标注协议,并设计了面向语言学习的标注方案。DECOR数据集的应用领域主要集中在自动写作评估系统中,旨在帮助第二语言学习者提高写作连贯性,从而更有效地传达思想。
The DECOR dataset was created by research teams from Columbia University and the University of California, Davis, specifically designed for evaluating and enhancing the coherence of second-language English writing. It contains 1,352 context-sentence pairs sourced from the TOEFL-11 corpus, which were meticulously annotated by experts to detect incoherence, identify its causes, and rewrite the incoherent sentences. The dataset's development follows the incremental annotation protocol proposed by Maimon and Tsarfaty (2023), with an annotation scheme tailored for language learning applications. The DECOR dataset is primarily applied in automated writing evaluation systems, aiming to help second-language learners improve their writing coherence and thus convey their ideas more effectively.
提供机构:
哥伦比亚大学,加利福尼亚大学戴维斯分校
创建时间:
2024-06-28
搜集汇总
数据集介绍

构建方式
DECOR数据集的构建基于TOEFL-11语料库中的中等级别作文,通过逐步标注协议创建语境-句子对,并由专家标注者识别不连贯的句子、确定不连贯的原因,并重写这些句子。该数据集包含了1,352个语境-句子对,其中213个不连贯句子及其专家重写的对应版本,为自动写作评估系统的连贯性评估提供了宝贵的资源。
特点
DECOR数据集的特点在于其新颖的基准设计,专门用于改善第二语言英语写作的连贯性。它包含专家标注,用于检测不连贯性、推理不连贯的原因,以及重写不连贯的句子。DECOR是第一个针对第二语言英语写作的连贯性评估数据集,其特点在于并行语料库,包括原始的不连贯句子及其专家修订版本。此外,该数据集还包含针对特定不连贯原因进行微调的模型,以自动检测和重写学生作文中的不连贯性。
使用方法
DECOR数据集的使用方法包括三个主要任务:不连贯性检测、推理和重写。用户可以利用这些任务来评估和改进自动写作评估系统的连贯性检测能力。此外,该数据集还提供了模型微调的示例,以展示如何使用特定原因进行微调以改善重写质量。DECOR数据集的发布将促进第二语言英语写作连贯性的研究和发展,为语言学习和教学提供有价值的资源。
背景与挑战
背景概述
DECOR数据集的创建旨在提升第二语言(L2)英语学习者在写作中的连贯性。连贯性是评估L2英语写作能力的关键因素,但现有的自动写作评估系统主要依赖于基本的表面语言特征来检测连贯性。DECOR数据集的引入填补了这一空白,它包括专家对L2英语写作中不连贯性的检测、原因识别和重写的注释。DECOR数据集是第一个专门为提高L2英语写作连贯性而设计的连贯性评估数据集,它具有原始不连贯句子及其专家重写版本的配对。该数据集为评估自动写作评估系统的连贯性提供了宝贵的资源,并为语言学习和教学提供了重要支持。
当前挑战
DECOR数据集面临的挑战主要包括:1) 领域问题挑战:如何有效地检测和纠正L2英语写作中的不连贯性,以帮助学习者提高写作技能。2) 构建挑战:在构建DECOR数据集的过程中,需要确保数据的质量和多样性,同时也要考虑到数据集的规模和可访问性。此外,现有的自动写作评估工具主要提供学习者写作连贯性的评分,而缺乏对不连贯性的原因识别和纠正功能。DECOR数据集的构建和模型微调实验结果表明,在微调过程中加入不连贯性的具体原因可以持续提高重写质量,达到自动和人工评估都青睐的结果。
常用场景
经典使用场景
DECOR数据集在第二语言(L2)英语写作中的连贯性评估方面具有开创性作用。该数据集通过专家注释,提供了检测L2英语写作中不连贯性的基准,并能够识别不连贯性的根本原因以及进行重写。DECOR数据集的特色在于其包含的原始不连贯句子与其专家重写的对应版本,这使得自动写作评估系统能够在连贯性评估方面得到有效评估。
实际应用
DECOR数据集的实际应用场景包括自动写作评估系统的连贯性评估,以及L2英语写作教学和研究的辅助工具。通过DECOR数据集,教师和研究者可以更好地理解L2英语写作中的连贯性问题,并针对性地进行教学和评估。此外,DECOR数据集还可以用于开发更精确的自动写作评估系统,为学生提供更有效的写作反馈。
衍生相关工作
DECOR数据集的推出,衍生了许多相关的研究工作。例如,基于DECOR数据集,研究者可以开发更精确的自动连贯性检测和纠正模型,以帮助学生提升写作水平。此外,DECOR数据集还可以用于研究L2英语写作中的连贯性问题,以及探索更有效的教学和评估方法。
以上内容由遇见数据集搜集并总结生成



