shunk031/STAIR-Captions
收藏Hugging Face2024-06-22 更新2024-06-25 收录
下载链接:
https://hf-mirror.com/datasets/shunk031/STAIR-Captions
下载链接
链接失效反馈官方服务:
资源简介:
STAIR Captions是一个大规模的数据集,包含820,310个日语字幕。该数据集可用于字幕生成、多模态检索和图像生成任务。数据集扩展自MSCOCO数据集,注释通过众包方式创建,语言为日语,许可证为CC-BY-4.0。数据集的结构包括多个配置版本,每个版本都有训练和验证集,数据字段包括图像ID、图像、文件名、COCO URL、高度、宽度、捕获日期、Flickr URL、许可证ID、许可证信息和注释。注释部分包括注释ID、图像ID和字幕。
STAIR Captions是一个大规模的数据集,包含820,310个日语字幕。该数据集可用于字幕生成、多模态检索和图像生成任务。数据集扩展自MSCOCO数据集,注释通过众包方式创建,语言为日语,许可证为CC-BY-4.0。数据集的结构包括多个配置版本,每个版本都有训练和验证集,数据字段包括图像ID、图像、文件名、COCO URL、高度、宽度、捕获日期、Flickr URL、许可证ID、许可证信息和注释。注释部分包括注释ID、图像ID和字幕。
提供机构:
shunk031
原始信息汇总
数据集概述
数据集描述
- 数据集名称: STAIR Captions
- 数据集简介: STAIR Captions 是一个大规模的数据集,包含 820,310 条日语描述。该数据集可用于图像描述生成、多模态检索和图像生成等任务。
- 语言: 日语
- 许可: Creative Commons Attribution 4.0 License
- 多语言性: 单语种
- 大小类别: 100K<n<1M
- 源数据集: 扩展自 MSCOCO
- 标签: 图像描述生成、MSCOCO
- 任务类别: 图像到文本
- 任务ID: 图像描述生成
数据集结构
配置信息
v1.0.0
- 特征:
image_id: int64image: imagefile_name: stringcoco_url: stringheight: int32width: int32date_captured: stringflickr_url: stringlicense_id: int32license: structurl: stringlicense_id: int8name: string
annotations: sequenceannotation_id: int64image_id: int64caption: string
- 分割:
train: 82783 个样本, 13636500472.001 字节validation: 40504 个样本, 6856928794.552 字节
- 下载大小: 20132168975 字节
- 数据集大小: 20493429266.553 字节
v1.1.0
- 特征:
image_id: int64image: imagefile_name: stringcoco_url: stringheight: int32width: int32date_captured: stringflickr_url: stringlicense_id: int32license: structurl: stringlicense_id: int8name: string
annotations: sequenceannotation_id: int64image_id: int64caption: string
- 分割:
train: 82783 个样本, 13636500472.001 字节validation: 40504 个样本, 6856928794.552 字节
- 下载大小: 20132168975 字节
- 数据集大小: 20493429266.553 字节
v1.2.0
- 特征:
image_id: int64image: imagefile_name: stringcoco_url: stringheight: int32width: int32date_captured: stringflickr_url: stringlicense_id: int32license: structurl: stringlicense_id: int8name: string
annotations: sequenceannotation_id: int64image_id: int64caption: string
- 分割:
train: 82783 个样本, 13635411411.001 字节validation: 40504 个样本, 6856395884.552 字节
- 下载大小: 20131797179 字节
- 数据集大小: 20491807295.553 字节
v1.2.0-tokenized
- 特征:
image_id: int64image: imagefile_name: stringcoco_url: stringheight: int32width: int32date_captured: stringflickr_url: stringlicense_id: int32license: structurl: stringlicense_id: int8name: string
annotations: sequenceannotation_id: int64image_id: int64caption: string
- 分割:
train: 82783 个样本, 13635411411.001 字节validation: 40504 个样本, 6856395884.552 字节
- 下载大小: 20131797179 字节
- 数据集大小: 20491807295.553 字节
数据集创建
- 注释创建者: 众包
- 语言创建者: 发现
其他信息
- 数据集创建者: @yuyay
- 引用信息: bibtex @inproceedings{yoshikawa2017stair, title={STAIR Captions: Constructing a Large-Scale Japanese Image Caption Dataset}, author={Yoshikawa, Yuya and Shigeto, Yutaro and Takeuchi, Akikazu}, booktitle={Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers)}, pages={417--421}, year={2017} }



