Visual Madlibs 图像描述数据集

超神经2022-09-08 更新2024-05-15 收录

下载链接：

https://hyper.ai/cn/datasets/19514

下载链接

链接失效反馈

官方服务：

资源简介：

Visual Madlibs 包含 360,001 个针对 10,738 幅图像的自然语言描述。该数据集使用已自动生成的空白填充模板收集一些目标描述，包括：人和物体、外貌、活动和互动、以及对一般场景或更广阔背景的推论。

Visual Madlibs contains 360,001 natural language descriptions for 10,738 images. This dataset uses automatically generated fill-in-the-blank templates to collect targeted descriptions including: people and objects, their appearance, activities and interactions, as well as inferences about general scenes or broader contextual backgrounds.

创建时间：

2022-09-08

搜集汇总

数据集介绍

背景与挑战

背景概述

Visual Madlibs 是一个图像描述数据集，包含 360,001 个针对 10,738 幅图像的自然语言描述，通过自动生成的空白填充模板收集，覆盖人和物体、外貌、活动和互动等目标描述。该数据集适用于图像理解、视觉文档检索和视觉问答等任务，发布于三年前，相关论文可在 arXiv 获取。

以上内容由遇见数据集搜集并总结生成