Word Sense Disambiguation: a Unified Evaluation Framework and Empirical Comparison

Name: Word Sense Disambiguation: a Unified Evaluation Framework and Empirical Comparison
Creator: OpenDataLab
License: 暂无描述

OpenXLab2026-04-18 收录

下载链接：

https://openxlab.org.cn/datasets/OpenDataLab/Word_Sense_Disambiguation_a_etc

下载链接

链接失效反馈

官方服务：

资源简介：

Raganato 等人的评估框架。 2017 年包括两个训练集（SemCor-Miller 等，1993-和 OMSTI-Taghipour 和 Ng，2015-）和 Senseval/SemEval 系列的五个测试集（Edmonds 和 Cotton，2001；Snyder 和 Palmer，2004；Pradhan 等al., 2007; Navigli et al., 2013; Moro and Navigli, 2015)，标准化为相同的格式和感觉库存（即 WordNet 3.0）。通常，WSD 有两种方法：有监督的（利用语义注释的训练数据）和基于知识的（利用词汇资源的属性）。监督：使用最广泛的训练语料库是 SemCor，手动注释了来自 352 个文档的 226,036 个语义注释。评估表中的所有受监督系统都在 SemCor 上进行了训练。一些监督方法，尤其是神经架构，通常使用 SemEval 2007 数据集作为开发集（用 * 标记）。最常见的基线是最常见的意义（MFS）启发式，它为每个目标词选择训练数据中最常见的意义。基于知识的：基于知识的系统通常利用 WordNet 或 BabelNet 作为语义网络。基础意义清单（即 WordNet 3.0）给出的第一个意义作为基线包含在内。 NLP 进度的描述

提供机构：

OpenDataLab

创建时间：

2022-05-23

5,000+

优质数据集

54 个

任务类型

进入经典数据集