five

VSR Dataset

收藏
paperswithcode.com2025-03-24 收录
下载链接:
https://paperswithcode.com/dataset/vsr
下载链接
链接失效反馈
官方服务:
资源简介:
The Visual Spatial Reasoning (VSR) corpus is a collection of caption-image pairs with true/false labels. Each caption describes the spatial relation of two individual objects in the image, and a vision-language model (VLM) needs to judge whether the caption is correctly describing the image (True) or not (False).

视觉空间推理(VSR)语料库是一组带有真/假标签的图像标题对。每个标题描述了图像中两个独立物体的空间关系,而视觉-语言模型(VLM)需要判断该标题是否正确地描述了图像(真)或未正确描述(假)。
提供机构:
paperswithcode.com
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作