five

shunk031/STAIR-Captions

收藏
Hugging Face2024-06-22 更新2024-06-25 收录
下载链接:
https://hf-mirror.com/datasets/shunk031/STAIR-Captions
下载链接
链接失效反馈
官方服务:
资源简介:
STAIR Captions是一个大规模的数据集,包含820,310个日语字幕。该数据集可用于字幕生成、多模态检索和图像生成任务。数据集扩展自MSCOCO数据集,注释通过众包方式创建,语言为日语,许可证为CC-BY-4.0。数据集的结构包括多个配置版本,每个版本都有训练和验证集,数据字段包括图像ID、图像、文件名、COCO URL、高度、宽度、捕获日期、Flickr URL、许可证ID、许可证信息和注释。注释部分包括注释ID、图像ID和字幕。

STAIR Captions是一个大规模的数据集,包含820,310个日语字幕。该数据集可用于字幕生成、多模态检索和图像生成任务。数据集扩展自MSCOCO数据集,注释通过众包方式创建,语言为日语,许可证为CC-BY-4.0。数据集的结构包括多个配置版本,每个版本都有训练和验证集,数据字段包括图像ID、图像、文件名、COCO URL、高度、宽度、捕获日期、Flickr URL、许可证ID、许可证信息和注释。注释部分包括注释ID、图像ID和字幕。
提供机构:
shunk031
原始信息汇总

数据集概述

数据集描述

  • 数据集名称: STAIR Captions
  • 数据集简介: STAIR Captions 是一个大规模的数据集,包含 820,310 条日语描述。该数据集可用于图像描述生成、多模态检索和图像生成等任务。
  • 语言: 日语
  • 许可: Creative Commons Attribution 4.0 License
  • 多语言性: 单语种
  • 大小类别: 100K<n<1M
  • 源数据集: 扩展自 MSCOCO
  • 标签: 图像描述生成、MSCOCO
  • 任务类别: 图像到文本
  • 任务ID: 图像描述生成

数据集结构

配置信息

v1.0.0

  • 特征:
    • image_id: int64
    • image: image
    • file_name: string
    • coco_url: string
    • height: int32
    • width: int32
    • date_captured: string
    • flickr_url: string
    • license_id: int32
    • license: struct
      • url: string
      • license_id: int8
      • name: string
    • annotations: sequence
      • annotation_id: int64
      • image_id: int64
      • caption: string
  • 分割:
    • train: 82783 个样本, 13636500472.001 字节
    • validation: 40504 个样本, 6856928794.552 字节
  • 下载大小: 20132168975 字节
  • 数据集大小: 20493429266.553 字节

v1.1.0

  • 特征:
    • image_id: int64
    • image: image
    • file_name: string
    • coco_url: string
    • height: int32
    • width: int32
    • date_captured: string
    • flickr_url: string
    • license_id: int32
    • license: struct
      • url: string
      • license_id: int8
      • name: string
    • annotations: sequence
      • annotation_id: int64
      • image_id: int64
      • caption: string
  • 分割:
    • train: 82783 个样本, 13636500472.001 字节
    • validation: 40504 个样本, 6856928794.552 字节
  • 下载大小: 20132168975 字节
  • 数据集大小: 20493429266.553 字节

v1.2.0

  • 特征:
    • image_id: int64
    • image: image
    • file_name: string
    • coco_url: string
    • height: int32
    • width: int32
    • date_captured: string
    • flickr_url: string
    • license_id: int32
    • license: struct
      • url: string
      • license_id: int8
      • name: string
    • annotations: sequence
      • annotation_id: int64
      • image_id: int64
      • caption: string
  • 分割:
    • train: 82783 个样本, 13635411411.001 字节
    • validation: 40504 个样本, 6856395884.552 字节
  • 下载大小: 20131797179 字节
  • 数据集大小: 20491807295.553 字节

v1.2.0-tokenized

  • 特征:
    • image_id: int64
    • image: image
    • file_name: string
    • coco_url: string
    • height: int32
    • width: int32
    • date_captured: string
    • flickr_url: string
    • license_id: int32
    • license: struct
      • url: string
      • license_id: int8
      • name: string
    • annotations: sequence
      • annotation_id: int64
      • image_id: int64
      • caption: string
  • 分割:
    • train: 82783 个样本, 13635411411.001 字节
    • validation: 40504 个样本, 6856395884.552 字节
  • 下载大小: 20131797179 字节
  • 数据集大小: 20491807295.553 字节

数据集创建

  • 注释创建者: 众包
  • 语言创建者: 发现

其他信息

  • 数据集创建者: @yuyay
  • 引用信息: bibtex @inproceedings{yoshikawa2017stair, title={STAIR Captions: Constructing a Large-Scale Japanese Image Caption Dataset}, author={Yoshikawa, Yuya and Shigeto, Yutaro and Takeuchi, Akikazu}, booktitle={Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers)}, pages={417--421}, year={2017} }
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作