five

SBU Captions Dataset

收藏
arXiv2025-09-30 收录
下载链接:
https://www.cs.rice.edu/~vo9/sbucaptions/
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了与SBU数据集中的图片相关联的标题,这些标题被用于图像文本检索的预训练。此外,该数据集还是预训练数据集的一部分,它与COCO、VG和CC数据集结合使用。其任务是进行图像文本检索的预训练。

This dataset contains captions associated with images from the SBU dataset, which are used for pre-training in image-text retrieval. Furthermore, this dataset is part of a pre-training corpus and is used in conjunction with the COCO, VG, and CC datasets. Its core objective is to support pre-training for image-text retrieval.
提供机构:
SBU
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
SBU Captions Dataset是一个包含100万张图像及其对应描述的大规模数据集,通过自动查询Flickr并过滤噪声数据构建,用于图像描述生成任务。该数据集支持非参数方法,并提供图像URL、描述和代码资源,旨在推动自动图像描述技术的研究与评估。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作