five

VCR 视觉常识推理数据集

收藏
超神经2024-02-09 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/17435
下载链接
链接失效反馈
官方服务:
资源简介:
VCR 全称 Visual Commonsense Reasoning,是一个用于视觉常识推理的大规模数据集。该数据集提出了关于图像的具有挑战性的问题,机器需要完成两个子任务:正确回答问题以及提供理由证明其答案的合理性。

VCR, short for Visual Commonsense Reasoning, is a large-scale dataset dedicated to visual commonsense reasoning. This dataset poses challenging questions about images, and requires machines to complete two subtasks: correctly answering the questions and providing justifications to validate the rationality of their answers.
创建时间:
2022-09-07
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
VCR(Visual Commonsense Reasoning)是一个大规模视觉常识推理数据集,旨在通过提问图像相关问题来评估机器的推理能力,要求机器正确回答问题并提供合理理由。该数据集包含约212K个训练问题、26K个验证问题和25K个测试问题,其答案和理由来源于超过110K个独特的电影场景。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务