five

mair-lab/vismin

收藏
Hugging Face2024-11-28 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/mair-lab/vismin
下载链接
链接失效反馈
官方服务:
资源简介:
VisMin数据集由四种类型的最小变化组成——对象、属性、计数和空间关系——这些变化存在于两个图像-描述对之间。评估任务要求模型在给定两种情况下预测正确的图像-描述匹配:1)两张图片和一个描述,2)两个描述和一张图片。VisMin基准包含2,084个样本,分为579个对象、294个属性、589个计数和622个关系。

VisMin consists of four types of minimal-changes – object, attribute, count and spatial relation – between two image-captions pairs. The evaluation task requires a model to predict the correct image-caption match given: 1) two images and one caption, 2) two captions and one image. The VisMin benchmark has 2,084 samples (579 objects, 294 attributes, 589 counting, 622 relations).
提供机构:
mair-lab
原始信息汇总

VisMin 数据集概述

数据集描述

VisMin 数据集包含四种最小变化类型:对象、属性、计数和空间关系,这些变化存在于两对图像-标题之间。

评估任务

评估任务要求模型在以下情况下预测正确的图像-标题匹配:

  1. 两张图像和一个标题。
  2. 两个标题和一张图像。

数据集规模

VisMin 基准测试包含 2,084 个样本,具体分布如下:

  • 对象:579 个
  • 属性:294 个
  • 计数:589 个
  • 空间关系:622 个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作