VQA-HAT(VQA Human Attention)
收藏OpenDataLab2026-05-31 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/VQA-HAT_VQA_Human_Attention
下载链接
链接失效反馈官方服务:
资源简介:
VQA-HAT,也称为VQA人类注意力,可以根据所问的问题评估图像的信息区域。康奈尔团队通过要求志愿者回答有关模糊图像锐化区域的问题,获得了人类视觉注意力的地图。
该数据集由原始VQA数据集中的图像上的人类视觉注意力图组成。它包含超过60k的人类视觉注意图。
VQA-HAT, also known as VQA Human Attention, is a dataset that can be used to evaluate the informative regions of an image based on the queried question. The Cornell research team derived human visual attention maps by having volunteers answer questions regarding the sharpened regions of blurred images. This dataset consists of human visual attention maps extracted from images in the original VQA dataset, and it contains over 60,000 such maps.
提供机构:
OpenDataLab
创建时间:
2023-04-20
搜集汇总
数据集介绍

背景与挑战
背景概述
VQA-HAT是一个包含超过60k人类视觉注意图的数据集,用于根据问题评估图像的信息区域,由康奈尔团队通过志愿者实验获得,发布于2016年。
以上内容由遇见数据集搜集并总结生成



