VCR 视觉常识推理数据集

超神经2024-02-09 更新2024-05-15 收录

下载链接：

https://hyper.ai/cn/datasets/17435

下载链接

链接失效反馈

官方服务：

资源简介：

VCR 全称 Visual Commonsense Reasoning，是一个用于视觉常识推理的大规模数据集。该数据集提出了关于图像的具有挑战性的问题，机器需要完成两个子任务：正确回答问题以及提供理由证明其答案的合理性。

VCR, short for Visual Commonsense Reasoning, is a large-scale dataset dedicated to visual commonsense reasoning. This dataset poses challenging questions about images, and requires machines to complete two subtasks: correctly answering the questions and providing justifications to validate the rationality of their answers.

创建时间：

2022-09-07

搜集汇总

数据集介绍

背景与挑战

背景概述

VCR（Visual Commonsense Reasoning）是一个大规模视觉常识推理数据集，旨在通过提问图像相关问题来评估机器的推理能力，要求机器正确回答问题并提供合理理由。该数据集包含约212K个训练问题、26K个验证问题和25K个测试问题，其答案和理由来源于超过110K个独特的电影场景。

以上内容由遇见数据集搜集并总结生成