MMEB-eval|多模态学习数据集|模型评估数据集
收藏Massive Multimodal Embedding Benchmark (MMEB)
概述
MMEB 是一个大规模多模态嵌入基准数据集,包含 36 个数据集,用于评估多模态嵌入模型的能力。每个数据集包含 1000 个测试样本,每个样本包含一个查询和一组目标,查询和目标可以是图像和文本的任意组合。
数据集配置
数据集列表
- A-OKVQA
- CIFAR-100
- CIRR
- ChartQA
- Country211
- DocVQA
- EDIS
- FashionIQ
- GQA
- HatefulMemes
- ImageNet-1K
- ImageNet-A
- ImageNet-R
- InfographicsVQA
- MSCOCO
- MSCOCO_i2t
- MSCOCO_t2i
- N24News
- NIGHTS
- OK-VQA
- OVEN
- ObjectNet
- Place365
- RefCOCO
- RefCOCO-Matching
- SUN397
- ScienceQA
- TextVQA
- VOC2007
- VisDial
- Visual7W
- Visual7W-Pointing
- VisualNews_i2t
- VisualNews_t2i
- VizWiz
- WebQA
- Wiki-SS-NQ
数据集特征
每个数据集包含以下特征:
qry_text
: 查询文本,类型为字符串。qry_img_path
: 查询图像路径,类型为字符串。tgt_text
: 目标文本序列,类型为字符串。tgt_img_path
: 目标图像路径序列,类型为字符串。
数据集分割
每个数据集仅包含一个测试集分割,包含 1000 个样本。
数据集大小
每个数据集的测试集大小和下载大小如下:
数据集名称 | 测试集大小 (bytes) | 下载大小 (bytes) |
---|---|---|
A-OKVQA | 14048199 | 1168340 |
CIFAR-100 | 1519890 | 20544 |
CIRR | 70162098 | 1565489 |
ChartQA | 14354641 | 1434448 |
Country211 | 3678000 | 31556 |
DocVQA | 23044459 | 1734476 |
EDIS | 184208708 | 3350382 |
FashionIQ | 71169665 | 1729457 |
GQA | 40809641 | 1764457 |
HatefulMemes | 184890 | 9972 |
ImageNet-1K | 28773890 | 185019 |
ImageNet-A | 28772890 | 147780 |
ImageNet-R | 3456890 | 23656 |
InfographicsVQA | 19114439 | 1439837 |
MSCOCO | 97759085 | 1681753 |
MSCOCO_i2t | 60201740 | 1785583 |
MSCOCO_t2i | 87127008 | 1296167 |
N24News | 630658 | 110698 |
NIGHTS | 75116000 | 1528646 |
OK-VQA | 15332578 | 1564823 |
OVEN | 717934263 | 406792141 |
ObjectNet | 2036000 | 27132 |
Place365 | 7045000 | 89866 |
RefCOCO | 96493941 | 1858145 |
RefCOCO-Matching | 145712476 | 2879385 |
SUN397 | 7990000 | 118447 |
ScienceQA | 23870406 | 958782 |
TextVQA | 17435986 | 1571656 |
VOC2007 | 368000 | 13813 |
VisDial | 67989850 | 1730820 |
Visual7W | 22047066 | 1564788 |
Visual7W-Pointing | 94906832 | 1299380 |
VisualNews_i2t | 118329649 | 81491360 |
VisualNews_t2i | 97176206 | 1763677 |
VizWiz | 20550246 | 1425789 |
WebQA | 197701404 | 3257136 |
Wiki-SS-NQ | 74583207 | 1900579 |
许可证
MIT 许可证
语言
英语
标签
- 排名
数据集名称
MMEB
数据集大小分类
10K < n < 100K

OpenSonarDatasets
OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。
github 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
FAOSTAT Forestry
FAOSTAT Forestry数据集包含了全球森林资源的相关统计数据,涵盖了森林面积、木材产量、森林管理等多个方面。该数据集提供了详细的国别数据,帮助用户了解全球森林资源的现状和变化趋势。
www.fao.org 收录
UAV123
从低空无人机捕获的视频与流行的跟踪数据集 (如OTB50,OTB100,VOT2014,VOT2015,TC128和ALOV300) 中的视频本质上不同。因此,我们提出了一个新的数据集 (UAV123),其序列来自空中视点,其子集用于长期空中跟踪 (UAV20L)。我们新的UAV123数据集包含总共123个视频序列和超过110K帧,使其成为仅次于ALOV300的第二大对象跟踪数据集。所有序列都用直立的边界框完全注释。数据集可以很容易地与视觉跟踪器基准集成。它包括无人机数据集的所有边界框和属性注释。还请使用包含序列和跟踪器配置的修改后的文件 “configSeqs.m” 和 “configTrackers.m” 下载修改后的跟踪器基准。另外,请注意,文件 “perfPlot.m” 已根据本文中描述的属性进行了修改以进行评估。
OpenDataLab 收录
poi
本项目收集国内POI兴趣点,当前版本数据来自于openstreetmap。
github 收录