WikiCREM

Name: WikiCREM
Creator: OpenDataLab
Published: 2026-05-17 08:30:06
License: 暂无描述

OpenDataLab2026-05-17 更新2024-05-09 收录

下载链接：

https://opendatalab.org.cn/OpenDataLab/WikiCREM

下载链接

链接失效反馈

官方服务：

资源简介：

代词解析是自然语言理解的一个主要领域。然而，大规模的训练集仍然稀缺，因为手动标记数据的成本很高。在这项工作中，我们介绍了 WikiCREM（Wikipedia CoREferences Masked）一个大规模但准确的代词消歧实例数据集。我们结合我们的 WikiCREM 数据集使用基于语言模型的代词解析方法。我们比较了一系列模型来解决各种具有挑战性的共指解决问题，在 7 个数据集中的 6 个数据集上，我们匹配或优于以前最先进的方法，例如 GAP、DPR、WNLI、PDP、WinoBias、和 WinoGender。我们发布了现成的模型来解决代词消歧问题。

提供机构：

OpenDataLab

创建时间：

2022-05-23

搜集汇总

数据集介绍