GQA
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/GQA
下载链接
链接失效反馈官方服务:
资源简介:
GQA 数据集是一个大规模的视觉问答数据集,包含来自视觉基因组数据集的真实图像和平衡的问答对。每个训练和验证图像还与描述场景中这些对象的类和属性以及它们的成对关系的场景图注释相关联。除了图像和问答对,GQA 数据集还为每张图像提供两种类型的预提取视觉特征——从在 ImageNet 上训练的 ResNet-101 网络中提取的大小为 7×7×2048 的卷积网格特征,以及对象检测来自 Faster R-CNN 检测器的大小为 Ndet×2048 的特征(其中 Ndet 是每张图像中检测到的对象的数量,每张图像最多 100 个)。
来源:用于关系推理的语言条件图网络
提供机构:
OpenDataLab
创建时间:
2022-05-23



