five

eduardem/ner_acro_combined

收藏
Hugging Face2023-09-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/eduardem/ner_acro_combined
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个多用途数据集,包含多种欧洲语言的名称、专有名词和缩略词,主要用于优化BERT或RoBERTa模型在Named Entity Recognition (NER)任务上的表现。数据集内容包括人名、地名、组织名等专有名词以及常用缩略词,主要语言包括英语、西班牙语、法语和罗马尼亚语。

这是一个多用途数据集,包含多种欧洲语言的名称、专有名词和缩略词,主要用于优化BERT或RoBERTa模型在Named Entity Recognition (NER)任务上的表现。数据集内容包括人名、地名、组织名等专有名词以及常用缩略词,主要语言包括英语、西班牙语、法语和罗马尼亚语。
提供机构:
eduardem
原始信息汇总

欧洲语言多用途NER数据集

简介

这是一个多用途数据集,包含来自多种欧洲语言的名称、专有名词和缩写词,特别适用于命名实体识别(NER)任务。

语言构成

数据集主要包含英语数据,其次是西班牙语、法语和罗马尼亚语。

目标

该数据集的主要目的是进一步微调基础BERT或RoBERTa模型,用于与命名实体识别(NER)相关的任务。

数据集内容

  • 名称:包括名字、姓氏和全名。
  • 专有名词:包括地点、组织等的名称。
  • 缩写词:包括在所涉及语言中常用的缩写词。

用途

该数据集可用于:

  • 微调BERT或RoBERTa模型以进行NER任务
  • 评估不同微调技术在NER上的效果
  • 进行多语言NER研究
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作