five

NEREL

收藏
OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/NEREL
下载链接
链接失效反馈
官方服务:
资源简介:
NEREL-BIO-俄语PubMed摘要的注释方案和语料库,英语摘要的数量较少。NEREL-BIO通过引入特定于域的实体类型来扩展通用域数据集NEREL。NEREL-BIO注释方案涵盖了通用和生物医学领域,使其适用于领域转移实验。NEREL-BIO为嵌套的命名实体提供注释,作为对NEREL采用的方案的扩展。嵌套的命名实体可能会跨越实体边界,以连接到嵌套在较长实体内的较短实体,从而使它们更难检测。NEREL-BIO包含700俄语和100英语摘要的注释。所有英文PubMed注释都有相应的俄语对应。因此,NEREL-BIO包括以下特定功能: 嵌套命名实体的注释,它可以用作跨域 (NEREL -> NEREL-BIO) 和跨语言 (英语-> 俄语) 转移的基准。我们对基于变压器的序列模型和机器阅读理解 (MRC) 模型进行了实验,并报告了其结果。
提供机构:
OpenDataLab
创建时间:
2022-11-18
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
NEREL-BIO是NEREL数据集的扩展版本,专注于俄语和少量英语PubMed摘要的命名实体识别,特别提供了嵌套实体的注释。该数据集包含700个俄语和100个英语摘要的注释,适用于跨域和跨语言转移实验,并基于序列模型和机器阅读理解模型进行了实验验证。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作