shunk031/STAIR-Captions

Name: shunk031/STAIR-Captions
Creator: shunk031
Published: 2024-06-22 06:23:12
License: 暂无描述

Hugging Face2024-06-22 更新2024-06-25 收录

下载链接：

https://hf-mirror.com/datasets/shunk031/STAIR-Captions

下载链接

链接失效反馈

官方服务：

资源简介：

STAIR Captions是一个大规模的数据集，包含820,310个日语字幕。该数据集可用于字幕生成、多模态检索和图像生成任务。数据集扩展自MSCOCO数据集，注释通过众包方式创建，语言为日语，许可证为CC-BY-4.0。数据集的结构包括多个配置版本，每个版本都有训练和验证集，数据字段包括图像ID、图像、文件名、COCO URL、高度、宽度、捕获日期、Flickr URL、许可证ID、许可证信息和注释。注释部分包括注释ID、图像ID和字幕。

提供机构：

shunk031

原始信息汇总

数据集概述

数据集描述

数据集名称: STAIR Captions
数据集简介: STAIR Captions 是一个大规模的数据集，包含 820,310 条日语描述。该数据集可用于图像描述生成、多模态检索和图像生成等任务。
语言: 日语
许可: Creative Commons Attribution 4.0 License
多语言性: 单语种
大小类别: 100K<n<1M
源数据集: 扩展自 MSCOCO
标签: 图像描述生成、MSCOCO
任务类别: 图像到文本
任务ID: 图像描述生成

数据集结构

配置信息

v1.0.0

特征:
- image_id: int64
- image: image
- file_name: string
- coco_url: string
- height: int32
- width: int32
- date_captured: string
- flickr_url: string
- license_id: int32
- license: struct
  - url: string
  - license_id: int8
  - name: string
- annotations: sequence
  - annotation_id: int64
  - image_id: int64
  - caption: string
分割:
- train: 82783 个样本, 13636500472.001 字节
- validation: 40504 个样本, 6856928794.552 字节
下载大小: 20132168975 字节
数据集大小: 20493429266.553 字节

v1.1.0

特征:
- image_id: int64
- image: image
- file_name: string
- coco_url: string
- height: int32
- width: int32
- date_captured: string
- flickr_url: string
- license_id: int32
- license: struct
  - url: string
  - license_id: int8
  - name: string
- annotations: sequence
  - annotation_id: int64
  - image_id: int64
  - caption: string
分割:
- train: 82783 个样本, 13636500472.001 字节
- validation: 40504 个样本, 6856928794.552 字节
下载大小: 20132168975 字节
数据集大小: 20493429266.553 字节

v1.2.0

特征:
- image_id: int64
- image: image
- file_name: string
- coco_url: string
- height: int32
- width: int32
- date_captured: string
- flickr_url: string
- license_id: int32
- license: struct
  - url: string
  - license_id: int8
  - name: string
- annotations: sequence
  - annotation_id: int64
  - image_id: int64
  - caption: string
分割:
- train: 82783 个样本, 13635411411.001 字节
- validation: 40504 个样本, 6856395884.552 字节
下载大小: 20131797179 字节
数据集大小: 20491807295.553 字节

v1.2.0-tokenized

特征:
- image_id: int64
- image: image
- file_name: string
- coco_url: string
- height: int32
- width: int32
- date_captured: string
- flickr_url: string
- license_id: int32
- license: struct
  - url: string
  - license_id: int8
  - name: string
- annotations: sequence
  - annotation_id: int64
  - image_id: int64
  - caption: string
分割:
- train: 82783 个样本, 13635411411.001 字节
- validation: 40504 个样本, 6856395884.552 字节
下载大小: 20131797179 字节
数据集大小: 20491807295.553 字节

数据集创建

注释创建者: 众包
语言创建者: 发现

其他信息

数据集创建者: @yuyay
引用信息: bibtex @inproceedings{yoshikawa2017stair, title={STAIR Captions: Constructing a Large-Scale Japanese Image Caption Dataset}, author={Yoshikawa, Yuya and Shigeto, Yutaro and Takeuchi, Akikazu}, booktitle={Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers)}, pages={417--421}, year={2017} }

5,000+

优质数据集

54 个

任务类型

进入经典数据集