mair-lab/vismin
收藏Hugging Face2024-11-28 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/mair-lab/vismin
下载链接
链接失效反馈官方服务:
资源简介:
VisMin数据集由四种类型的最小变化组成——对象、属性、计数和空间关系——这些变化存在于两个图像-描述对之间。评估任务要求模型在给定两种情况下预测正确的图像-描述匹配:1)两张图片和一个描述,2)两个描述和一张图片。VisMin基准包含2,084个样本,分为579个对象、294个属性、589个计数和622个关系。
VisMin consists of four types of minimal-changes – object, attribute, count and spatial relation – between two image-captions pairs. The evaluation task requires a model to predict the correct image-caption match given: 1) two images and one caption, 2) two captions and one image. The VisMin benchmark has 2,084 samples (579 objects, 294 attributes, 589 counting, 622 relations).
提供机构:
mair-lab
原始信息汇总
VisMin 数据集概述
数据集描述
VisMin 数据集包含四种最小变化类型:对象、属性、计数和空间关系,这些变化存在于两对图像-标题之间。
评估任务
评估任务要求模型在以下情况下预测正确的图像-标题匹配:
- 两张图像和一个标题。
- 两个标题和一张图像。
数据集规模
VisMin 基准测试包含 2,084 个样本,具体分布如下:
- 对象:579 个
- 属性:294 个
- 计数:589 个
- 空间关系:622 个



