five

ZS-F-VQA

收藏
OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/ZS-F-VQA
下载链接
链接失效反馈
官方服务:
资源简介:
ZS-F-VQA 数据集是针对零样本问题的 F-VQA 数据集的新拆分。 首先,我们获得 F-VQA 数据集的原始训练/测试分割,并将它们组合在一起,根据其出现频率过滤出答案出现在前 500 名的三元组。 接下来,我们以 1:1 的比例将这组答案随机分成新的训练拆分(也称为可见)$\mathcal{A}_s$ 和测试拆分(又名未见过)$\mathcal{A}_u$。 参考 F-VQA 标准数据集,划分过程重复 5 次。 对于原始 F-VQA 数据集中的每个 $(i,q,a)$ 三元组,如果 $a \in \mathcal{A}_s$ 则将其划分为训练集。否则它被分成测试集。 F-VQA 中训练和测试集的答案实例重叠为 2565 美元,而 ZS-F-VQA 中为 0 美元。

The ZS-F-VQA dataset is a novel split of the F-VQA dataset designed for zero-shot problems. First, we retrieve the original train and test splits of the F-VQA dataset, merge them into a unified corpus, and then filter out triples whose answers rank among the top 500 in terms of occurrence frequency. Next, we randomly split this set of candidate answers into a new training split (also termed visible) $mathcal{A}_s$ and a test split (also referred to as unseen) $mathcal{A}_u$ at a 1:1 ratio. Following the standard protocol of the F-VQA dataset, we repeat this splitting process 5 times. For each $(i,q,a)$ triple in the original F-VQA dataset, if the answer $a in mathcal{A}_s$, we assign it to the training set; otherwise, it is allocated to the test set. The number of overlapping answer instances between the training and test splits of the original F-VQA dataset is 2565, while that of the ZS-F-VQA dataset is 0.
提供机构:
OpenDataLab
创建时间:
2022-06-28
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
ZS-F-VQA是一个针对零样本视觉问答任务的数据集,通过对原始F-VQA数据集进行重新划分,将答案按频率过滤后随机分为训练集和测试集,确保两者无重叠。该数据集由多所大学和企业于2021年联合发布,用于支持知识图谱在零样本视觉问答中的研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作