five

CompLex 2.0

收藏
arXiv2022-11-03 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2102.08773v2
下载链接
链接失效反馈
官方服务:
资源简介:
CompLex 2.0是由曼彻斯特都会大学的Matthew Shardlow等人开发的一个新的英语词汇复杂度预测数据集。该数据集基于Likert量表的评分,涵盖了多个领域,包括圣经、欧洲议会和生物医学文本,旨在通过连续的复杂度评分来评估词汇的复杂性。数据集包含10,800个词汇实例,每个实例都有多个注释,以确保评分的准确性和可靠性。CompLex 2.0特别关注于词汇在不同语境中的复杂度变化,以及多词表达(MWEs)的复杂度评估,为研究词汇复杂度预测提供了丰富的资源。

CompLex 2.0 is a novel English lexical complexity prediction dataset developed by Matthew Shardlow et al. from Manchester Metropolitan University. Constructed using Likert-scale ratings, the dataset covers multiple domains including biblical texts, European Parliament proceedings, and biomedical literature, aiming to evaluate lexical complexity via continuous complexity scoring. It contains 10,800 lexical instances, each with multiple annotations to ensure the accuracy and reliability of the ratings. CompLex 2.0 specifically focuses on contextual variations in lexical complexity and the complexity evaluation of multi-word expressions (MWEs), serving as a valuable resource for research on lexical complexity prediction.
提供机构:
曼彻斯特都会大学
创建时间:
2021-02-17
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作