five

WikiCREM

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/WikiCREM
下载链接
链接失效反馈
官方服务:
资源简介:
代词解析是自然语言理解的一个主要领域。然而,大规模的训练集仍然稀缺,因为手动标记数据的成本很高。在这项工作中,我们介绍了 WikiCREM(Wikipedia CoREferences Masked)一个大规模但准确的代词消歧实例数据集。我们结合我们的 WikiCREM 数据集使用基于语言模型的代词解析方法。我们比较了一系列模型来解决各种具有挑战性的共指解决问题,在 7 个数据集中的 6 个数据集上,我们匹配或优于以前最先进的方法,例如 GAP、DPR、WNLI、PDP、WinoBias、和 WinoGender。我们发布了现成的模型来解决代词消歧问题。
提供机构:
OpenDataLab
创建时间:
2022-05-23
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
WikiCREM是一个大规模且准确的代词消歧数据集,基于Wikipedia构建,用于自然语言理解中的代词解析任务。该数据集结合语言模型方法,在多个基准测试中达到或超越了最先进性能,并提供了现成的解决模型。它由DeepMind、牛津大学等机构于2019年发布。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作