MMID(Massively Multilingual Image Dataset)
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/MMID
下载链接
链接失效反馈官方服务:
资源简介:
MMID 是一个大规模、大规模的多语言图像数据集,与在宾夕法尼亚大学收集的它们所代表的单词配对。数据集是双重并行的:对于每种语言,单词与表示单词的图像并行存储,并且与单词翻译成英语(和相应的图像)并行存储。
迄今为止最大的同类数据集,它有 98 种语言(包括英语),每种语言多达 10,000 个单词! (还有更多的英语。)
提供机构:
OpenDataLab
创建时间:
2022-08-19
搜集汇总
数据集介绍

背景与挑战
背景概述
MMID是一个大规模多语言图像数据集,包含98种语言,每种语言最多有10,000个单词,并与表示这些单词的图像配对。该数据集由宾夕法尼亚大学于2018年发布,旨在通过图像学习单词翻译。
以上内容由遇见数据集搜集并总结生成



