ProLex
收藏arXiv2024-02-12 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2401.11356v2
下载链接
链接失效反馈官方服务:
资源简介:
ProLex是一个针对语言熟练度导向的词汇替换基准数据集,旨在评估系统生成既适当又显示更高语言熟练度的替换词的能力。该数据集由哥伦比亚大学计算机科学系创建,主要从TOEFL-11语料库中选取非母语英语学习者的文章,确保数据分布更代表L2英语学习者。数据集构建过程中,利用GPT-4生成初始替换候选,并通过人工标注判断其适当性,同时采用CEFR标准过滤出与目标词同等或更高熟练度的替换词。ProLex的应用领域主要集中在帮助L2英语学习者提高词汇多样性和写作熟练度,通过提供高级熟练度水平的替换词,增强学习者的写作能力。
提供机构:
哥伦比亚大学计算机科学系
创建时间:
2024-01-21



