eduardem/ner_acro_combined
收藏Hugging Face2023-09-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/eduardem/ner_acro_combined
下载链接
链接失效反馈官方服务:
资源简介:
这是一个多用途数据集,包含多种欧洲语言的名称、专有名词和缩略词,主要用于优化BERT或RoBERTa模型在Named Entity Recognition (NER)任务上的表现。数据集内容包括人名、地名、组织名等专有名词以及常用缩略词,主要语言包括英语、西班牙语、法语和罗马尼亚语。
这是一个多用途数据集,包含多种欧洲语言的名称、专有名词和缩略词,主要用于优化BERT或RoBERTa模型在Named Entity Recognition (NER)任务上的表现。数据集内容包括人名、地名、组织名等专有名词以及常用缩略词,主要语言包括英语、西班牙语、法语和罗马尼亚语。
提供机构:
eduardem
原始信息汇总
欧洲语言多用途NER数据集
简介
这是一个多用途数据集,包含来自多种欧洲语言的名称、专有名词和缩写词,特别适用于命名实体识别(NER)任务。
语言构成
数据集主要包含英语数据,其次是西班牙语、法语和罗马尼亚语。
目标
该数据集的主要目的是进一步微调基础BERT或RoBERTa模型,用于与命名实体识别(NER)相关的任务。
数据集内容
- 名称:包括名字、姓氏和全名。
- 专有名词:包括地点、组织等的名称。
- 缩写词:包括在所涉及语言中常用的缩写词。
用途
该数据集可用于:
- 微调BERT或RoBERTa模型以进行NER任务
- 评估不同微调技术在NER上的效果
- 进行多语言NER研究



