Visual Madlibs 图像描述数据集
收藏超神经2022-09-08 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/19514
下载链接
链接失效反馈官方服务:
资源简介:
Visual Madlibs 包含 360,001 个针对 10,738 幅图像的自然语言描述。该数据集使用已自动生成的空白填充模板收集一些目标描述,包括:人和物体、外貌、活动和互动、以及对一般场景或更广阔背景的推论。
Visual Madlibs contains 360,001 natural language descriptions for 10,738 images. This dataset uses automatically generated fill-in-the-blank templates to collect targeted descriptions including: people and objects, their appearance, activities and interactions, as well as inferences about general scenes or broader contextual backgrounds.
创建时间:
2022-09-08
搜集汇总
数据集介绍

背景与挑战
背景概述
Visual Madlibs 是一个图像描述数据集,包含 360,001 个针对 10,738 幅图像的自然语言描述,通过自动生成的空白填充模板收集,覆盖人和物体、外貌、活动和互动等目标描述。该数据集适用于图像理解、视觉文档检索和视觉问答等任务,发布于三年前,相关论文可在 arXiv 获取。
以上内容由遇见数据集搜集并总结生成



