five

vicenteor/sbu_captions

收藏
Hugging Face2024-01-18 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/vicenteor/sbu_captions
下载链接
链接失效反馈
官方服务:
资源简介:
SBU Captioned Photo Dataset是一个包含来自Flickr的图像及其相关标题的数据集。该数据集主要用于图像到文本的任务,特别是图像字幕生成。每个数据实例包含一个图像URL、用户ID和图像标题。数据集的所有数据都包含在训练集中,共有100万个实例。数据集的创建过程涉及从Flickr进行大量查询,并过滤出与图像视觉相关的标题。数据集的标题语言为英语。

SBU Captioned Photo Dataset是一个包含来自Flickr的图像及其相关标题的数据集。该数据集主要用于图像到文本的任务,特别是图像字幕生成。每个数据实例包含一个图像URL、用户ID和图像标题。数据集的所有数据都包含在训练集中,共有100万个实例。数据集的创建过程涉及从Flickr进行大量查询,并过滤出与图像视觉相关的标题。数据集的标题语言为英语。
提供机构:
vicenteor
原始信息汇总

数据集概述

数据集名称

  • 名称: SBU Captioned Photo Dataset
  • 别名: sbu_captions

数据集基本信息

  • 语言: 英语
  • 许可证: 未知
  • 多语言性: 单语种
  • 大小: 1M<n<10M
  • 源数据: 原始数据
  • 任务类别: 图像到文本
  • 任务ID: image-captioning
  • 论文代码ID: sbu-captions-dataset

数据集特征

  • image_url: 图像的URL,数据类型为字符串。
  • user_id: 用户的ID,数据类型为字符串。
  • caption: 图像的描述文本,数据类型为字符串。

数据集结构

  • 数据实例: 每个实例包含一个图像URL、一个用户ID和一个描述文本。
  • 数据字段:
    • image_url: 图像的静态URL。
    • caption: 图像的文本描述。
    • user_id: 描述文本的作者。
  • 数据分割: 所有数据包含在训练集中,训练集包含100万实例。

数据集创建

  • 来源数据: 图像来源于Flickr。
  • 初始数据收集和标准化: 通过大量Flickr查询收集,并过滤出100万张带有视觉相关描述的图像。
  • 注释过程: 图像的描述文本作为注释/标题继承。
  • 注释者: Flickr用户。

使用数据注意事项

  • 许可证信息: 未指定。
  • 引用信息: bibtex @inproceedings{NIPS2011_5dd9db5e, author = {Ordonez, Vicente and Kulkarni, Girish and Berg, Tamara}, booktitle = {Advances in Neural Information Processing Systems}, editor = {J. Shawe-Taylor and R. Zemel and P. Bartlett and F. Pereira and K.Q. Weinberger}, pages = {}, publisher = {Curran Associates, Inc.}, title = {Im2Text: Describing Images Using 1 Million Captioned Photographs}, url = {https://proceedings.neurips.cc/paper/2011/file/5dd9db5e033da9c6fb5ba83c7a7ebea9-Paper.pdf}, volume = {24}, year = {2011} }
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作