five

MMNER

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/wangdsh/MMNERD
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个大规模的多语言和多模态命名实体识别(NER)数据集,包含四种语言(英语、法语、德语和西班牙语)的图像-文本对。该数据集涵盖四个类别(人物、地点、组织和杂项),共89,019个实体,并且已经通过高可靠性的手动标注(Cohen's kappa系数为0.96)。其规模达到33,965个图像-文本对,适用于多语言和多模态命名实体识别(Mmner)任务。

This dataset is a large-scale multilingual and multimodal named entity recognition (NER) dataset containing image-text pairs across four languages: English, French, German and Spanish. It covers four categories (person, location, organization and miscellaneous) with a total of 89,019 entities, and has been manually annotated with high reliability (Cohen's kappa coefficient of 0.96). Comprising 33,965 image-text pairs, this dataset is suitable for multilingual and multimodal named entity recognition (Mmner) tasks.
提供机构:
Hugging Face, Twitter-2017
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作