vicenteor/sbu_captions

Name: vicenteor/sbu_captions
Creator: vicenteor
Published: 2024-01-18 11:19:05
License: 暂无描述

Hugging Face2024-01-18 更新2024-05-25 收录

下载链接：

https://hf-mirror.com/datasets/vicenteor/sbu_captions

下载链接

链接失效反馈

官方服务：

资源简介：

SBU Captioned Photo Dataset是一个包含来自Flickr的图像及其相关标题的数据集。该数据集主要用于图像到文本的任务，特别是图像字幕生成。每个数据实例包含一个图像URL、用户ID和图像标题。数据集的所有数据都包含在训练集中，共有100万个实例。数据集的创建过程涉及从Flickr进行大量查询，并过滤出与图像视觉相关的标题。数据集的标题语言为英语。

提供机构：

vicenteor

原始信息汇总

数据集概述

数据集名称

名称: SBU Captioned Photo Dataset
别名: sbu_captions

数据集基本信息

语言: 英语
许可证: 未知
多语言性: 单语种
大小: 1M<n<10M
源数据: 原始数据
任务类别: 图像到文本
任务ID: image-captioning
论文代码ID: sbu-captions-dataset

数据集特征

image_url: 图像的URL，数据类型为字符串。
user_id: 用户的ID，数据类型为字符串。
caption: 图像的描述文本，数据类型为字符串。

数据集结构

数据实例: 每个实例包含一个图像URL、一个用户ID和一个描述文本。
数据字段:
- image_url: 图像的静态URL。
- caption: 图像的文本描述。
- user_id: 描述文本的作者。
数据分割: 所有数据包含在训练集中，训练集包含100万实例。

数据集创建

来源数据: 图像来源于Flickr。
初始数据收集和标准化: 通过大量Flickr查询收集，并过滤出100万张带有视觉相关描述的图像。
注释过程: 图像的描述文本作为注释/标题继承。
注释者: Flickr用户。

使用数据注意事项

许可证信息: 未指定。
引用信息: bibtex @inproceedings{NIPS2011_5dd9db5e, author = {Ordonez, Vicente and Kulkarni, Girish and Berg, Tamara}, booktitle = {Advances in Neural Information Processing Systems}, editor = {J. Shawe-Taylor and R. Zemel and P. Bartlett and F. Pereira and K.Q. Weinberger}, pages = {}, publisher = {Curran Associates, Inc.}, title = {Im2Text: Describing Images Using 1 Million Captioned Photographs}, url = {https://proceedings.neurips.cc/paper/2011/file/5dd9db5e033da9c6fb5ba83c7a7ebea9-Paper.pdf}, volume = {24}, year = {2011} }

5,000+

优质数据集

54 个

任务类型

进入经典数据集