stefan-it/autotrain-flair-hipe2022-de-hmbert
收藏Hugging Face2023-09-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/stefan-it/autotrain-flair-hipe2022-de-hmbert
下载链接
链接失效反馈官方服务:
资源简介:
该数据集主要用于命名实体识别(NER)模型的微调,涉及多种语言和数据集,包括英语、德语、法语、芬兰语、瑞典语和荷兰语。数据集来源于HIPE-2020、HIPE-2022和Europeana等项目,涵盖了多种历史文献和新闻数据。
提供机构:
stefan-it
原始信息汇总
NER Fine-Tuning 数据集概述
数据集来源
- HIPE-2022 数据集:用于微调 NER 模型,来源于 HIPE-2022 Shared Task。
语言和数据集
- 英语:
- AjMC
- TopRes19th
- 德语:
- AjMC
- NewsEye
- 法语:
- AjMC
- ICDAR-Europeana
- LeTemps
- NewsEye
- 芬兰语:
- NewsEye
- 瑞典语:
- NewsEye
- 荷兰语:
- ICDAR-Europeana
结果
- 模型性能:报告了在开发集上平均 F1 分数的结果。
| 模型 | 英语 AjMC | 德语 AjMC | 法语 AjMC | 德语 NewsEye | 法语 NewsEye | 芬兰语 NewsEye | 瑞典语 NewsEye | 荷兰语 ICDAR | 法语 ICDAR | 法语 LeTemps | 英语 TopRes19th | 平均 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| hmBERT (32k) Schweter et al. | 85.36 ± 0.94 | 89.08 ± 0.09 | 85.10 ± 0.60 | 39.65 ± 1.01 | 81.47 ± 0.36 | 77.28 ± 0.37 | 82.85 ± 0.83 | 82.11 ± 0.61 | 77.21 ± 0.16 | 65.73 ± 0.56 | 80.94 ± 0.86 | 76.98 |
| hmTEAMS (Ours) | 86.41 ± 0.36 | 88.64 ± 0.42 | 85.41 ± 0.67 | 41.51 ± 2.82 | 83.20 ± 0.79 | 79.27 ± 1.88 | 82.78 ± 0.60 | 88.21 ± 0.39 | 78.03 ± 0.39 | 66.71 ± 0.46 | 81.36 ± 0.59 | 78.32 |



