MMNER
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/wangdsh/MMNERD
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个大规模的多语言和多模态命名实体识别(NER)数据集,包含四种语言(英语、法语、德语和西班牙语)的图像-文本对。该数据集涵盖四个类别(人物、地点、组织和杂项),共89,019个实体,并且已经通过高可靠性的手动标注(Cohen's kappa系数为0.96)。其规模达到33,965个图像-文本对,适用于多语言和多模态命名实体识别(Mmner)任务。
提供机构:
Hugging Face, Twitter-2017



