Word Sense Disambiguation: a Unified Evaluation Framework and Empirical Comparison
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/Word_Sense_Disambiguation_a_etc
下载链接
链接失效反馈官方服务:
资源简介:
Raganato 等人的评估框架。 2017 年包括两个训练集(SemCor-Miller 等,1993-和 OMSTI-Taghipour 和 Ng,2015-)和 Senseval/SemEval 系列的五个测试集(Edmonds 和 Cotton,2001;Snyder 和 Palmer,2004;Pradhan 等al., 2007; Navigli et al., 2013; Moro and Navigli, 2015),标准化为相同的格式和感觉库存(即 WordNet 3.0)。通常,WSD 有两种方法:有监督的(利用语义注释的训练数据)和基于知识的(利用词汇资源的属性)。监督:使用最广泛的训练语料库是 SemCor,手动注释了来自 352 个文档的 226,036 个语义注释。评估表中的所有受监督系统都在 SemCor 上进行了训练。一些监督方法,尤其是神经架构,通常使用 SemEval 2007 数据集作为开发集(用 * 标记)。最常见的基线是最常见的意义(MFS)启发式,它为每个目标词选择训练数据中最常见的意义。基于知识的:基于知识的系统通常利用 WordNet 或 BabelNet 作为语义网络。基础意义清单(即 WordNet 3.0)给出的第一个意义作为基线包含在内。 NLP 进度的描述
提供机构:
OpenDataLab
创建时间:
2022-05-23



