Flickr30k多模态图像-文本对齐数据集
收藏国家基础学科公共科学数据中心2026-01-30 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=674b68d8195d2661e1ba4115&type=1
下载链接
链接失效反馈官方服务:
资源简介:
Flickr30k 数据集是一个重要的多模态数据集,用于图像描述生成、视觉问答、图像检索等任务的研究。它包含了丰富的图像数据以及与之相关的文本描述,旨在帮助研究人员开发能够理解和描述图像内容的模型。图像数据:Flickr30k 包含了31,783张来自Flickr网站的图像。这些图像涵盖了多样化的日常生活场景,提供了丰富的视觉内容和上下文信息。文本描述:每张图像都附带了5个不同的英文描述,共计158,915条描述。这些描述是由人工编写的,旨在详细而准确地描述图片内容,有助于模型学习到多种表述同一场景的方式。
提供机构:
海南大学



