vicenteor/sbu_captions
收藏Hugging Face2024-01-18 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/vicenteor/sbu_captions
下载链接
链接失效反馈官方服务:
资源简介:
SBU Captioned Photo Dataset是一个包含来自Flickr的图像及其相关标题的数据集。该数据集主要用于图像到文本的任务,特别是图像字幕生成。每个数据实例包含一个图像URL、用户ID和图像标题。数据集的所有数据都包含在训练集中,共有100万个实例。数据集的创建过程涉及从Flickr进行大量查询,并过滤出与图像视觉相关的标题。数据集的标题语言为英语。
SBU Captioned Photo Dataset是一个包含来自Flickr的图像及其相关标题的数据集。该数据集主要用于图像到文本的任务,特别是图像字幕生成。每个数据实例包含一个图像URL、用户ID和图像标题。数据集的所有数据都包含在训练集中,共有100万个实例。数据集的创建过程涉及从Flickr进行大量查询,并过滤出与图像视觉相关的标题。数据集的标题语言为英语。
提供机构:
vicenteor
原始信息汇总
数据集概述
数据集名称
- 名称: SBU Captioned Photo Dataset
- 别名: sbu_captions
数据集基本信息
- 语言: 英语
- 许可证: 未知
- 多语言性: 单语种
- 大小: 1M<n<10M
- 源数据: 原始数据
- 任务类别: 图像到文本
- 任务ID: image-captioning
- 论文代码ID: sbu-captions-dataset
数据集特征
- image_url: 图像的URL,数据类型为字符串。
- user_id: 用户的ID,数据类型为字符串。
- caption: 图像的描述文本,数据类型为字符串。
数据集结构
- 数据实例: 每个实例包含一个图像URL、一个用户ID和一个描述文本。
- 数据字段:
image_url: 图像的静态URL。caption: 图像的文本描述。user_id: 描述文本的作者。
- 数据分割: 所有数据包含在训练集中,训练集包含100万实例。
数据集创建
- 来源数据: 图像来源于Flickr。
- 初始数据收集和标准化: 通过大量Flickr查询收集,并过滤出100万张带有视觉相关描述的图像。
- 注释过程: 图像的描述文本作为注释/标题继承。
- 注释者: Flickr用户。
使用数据注意事项
- 许可证信息: 未指定。
- 引用信息: bibtex @inproceedings{NIPS2011_5dd9db5e, author = {Ordonez, Vicente and Kulkarni, Girish and Berg, Tamara}, booktitle = {Advances in Neural Information Processing Systems}, editor = {J. Shawe-Taylor and R. Zemel and P. Bartlett and F. Pereira and K.Q. Weinberger}, pages = {}, publisher = {Curran Associates, Inc.}, title = {Im2Text: Describing Images Using 1 Million Captioned Photographs}, url = {https://proceedings.neurips.cc/paper/2011/file/5dd9db5e033da9c6fb5ba83c7a7ebea9-Paper.pdf}, volume = {24}, year = {2011} }



