five

Flickr_Image

收藏
魔搭社区2025-08-19 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/Flickr_Image
下载链接
链接失效反馈
官方服务:
资源简介:
displayName: Flickr Image labelTypes: - Text license: - CC0 1.0 mediaTypes: - Image paperUrl: "" publishDate: "2018" publishUrl: https://docs.activeloop.ai/datasets/flickr30k-dataset publisher: - University of Illinois Urbana-Champaign tags: - Botany taskTypes: - Image Caption --- # 数据集介绍 ## 简介 Flickr30k 数据集已成为基于句子的图像描述的标准基准。本文介绍了 Flickr30k 实体,它使用 244k 共指链增强了来自 Flickr30k 的 158k 字幕,将同一图像的不同字幕中提及的相同实体链接起来,并将它们与 276k 手动注释的边界框相关联。这种注释对于自动图像描述和基础语言理解的持续进步至关重要。它们使我们能够为图像中文本实体提及的本地化定义一个新基准。我们为这项任务提供了一个强大的基线,它结合了图像-文本嵌入、常见对象的检测器、颜色分类器以及对选择较大对象的偏见。 ## 引文 ``` @article{plummer2017flickr30k, title={Flickr30k Entities: Collecting Region-to-Phrase Correspondences for Richer Image-to-Sentence Models}, author={Plummer, A. Bryan and Wang, Liwei and Cervantes, M. Chris and Caicedo, C. Juan and Hockenmaier, Julia and Lazebnik, Svetlana}, journal={International Journal of Computer Vision}, pages={74--93}, year={2017} } ``` ## Download dataset :modelscope-code[]{type="git"}

显示名称:Flickr图像(Flickr Image) 标签类型:文本(Text) 许可协议:CC0 1.0 媒体类型:图像(Image) 论文链接:无 发布日期:2018年 发布页面链接:https://docs.activeloop.ai/datasets/flickr30k-dataset 发布机构:伊利诺伊大学厄巴纳-香槟分校(University of Illinois Urbana-Champaign) 标签:植物学(Botany) 任务类型:图像字幕(Image Caption) --- # 数据集介绍 ## 简介 Flickr30k数据集已成为基于句子的图像描述任务的标准基准数据集。本文所提出的Flickr30k实体(Flickr30k Entities),通过24.4万条共指链对Flickr30k数据集的15.8万条字幕进行增强:将同一张图像不同字幕中提及的同一实体进行关联链接,并将这些实体与27.6万条人工标注的边界框进行绑定。此类标注对于自动图像描述与基础语言理解的持续演进至关重要,同时可为图像中文本实体提及的本地化任务构建全新的基准评测体系。本研究为该任务打造了一款高性能基线模型,该模型融合了图像-文本嵌入、通用目标检测器、颜色分类器,以及针对大尺寸目标的选择偏好机制。 ## 引文 @article{plummer2017flickr30k, title={Flickr30k Entities: Collecting Region-to-Phrase Correspondences for Richer Image-to-Sentence Models}, author={Plummer, A. Bryan and Wang, Liwei and Cervantes, M. Chris and Caicedo, C. Juan and Hockenmaier, Julia and Lazebnik, Svetlana}, journal={International Journal of Computer Vision}, pages={74--93}, year={2017} } ## 数据集下载 :modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-12
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作