five

ProLex

收藏
arXiv2024-02-12 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2401.11356v2
下载链接
链接失效反馈
官方服务:
资源简介:
ProLex是一个针对语言熟练度导向的词汇替换基准数据集,旨在评估系统生成既适当又显示更高语言熟练度的替换词的能力。该数据集由哥伦比亚大学计算机科学系创建,主要从TOEFL-11语料库中选取非母语英语学习者的文章,确保数据分布更代表L2英语学习者。数据集构建过程中,利用GPT-4生成初始替换候选,并通过人工标注判断其适当性,同时采用CEFR标准过滤出与目标词同等或更高熟练度的替换词。ProLex的应用领域主要集中在帮助L2英语学习者提高词汇多样性和写作熟练度,通过提供高级熟练度水平的替换词,增强学习者的写作能力。
提供机构:
哥伦比亚大学计算机科学系
创建时间:
2024-01-21
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作