Flickr30k Entities Dataset
收藏知名数据集2026-04-23 收录
下载链接:
https://bryanplummer.com/Flickr30kEntities/
下载链接
链接失效反馈官方服务:
资源简介:
Flickr30k Entities是一个用于图像描述和视觉问答任务的数据集,由伊利诺伊大学厄巴纳-香槟分校的研究团队开发。该数据集在Flickr30k的158,915条图像描述基础上,增加了244,000个共指链和276,000个手动标注的边界框,实现了图像中实体与文本描述的精确对应。它为研究图像-文本匹配、实体链接和视觉问答等多模态任务提供了重要基准资源,广泛应用于计算机视觉与自然语言处理的交叉领域。
提供机构:
伊利诺伊大学厄巴纳-香槟分校



