whyen-wang/coco_captions
收藏数据集卡片:COCO Captions
数据集描述
数据集概述
COCO Captions 是一个大规模的对象检测、分割和字幕生成数据集。
支持的任务和排行榜
- 图像到文本(Image to Text)
语言
- 英语(en)
数据集结构
数据实例
一个示例数据实例如下: json { "image": PIL.Image(mode="RGB"), "captions": [ "Closeup of bins of food that include broccoli and bread.", "A meal is presented in brightly colored plastic trays.", "there are containers filled with different kinds of foods", "Colorful dishes holding meat, vegetables, fruit, and bread.", "A bunch of trays that have different food." ] }
数据字段
- 图像(image):PIL.Image 对象
- 字幕(captions):包含多个字幕的列表
数据分割
| 名称 | 训练集 | 验证集 |
|---|---|---|
| 默认 | 118,287 | 5,000 |
数据集创建
数据集策划理由
[更多信息待补充]
源数据
初始数据收集和规范化
[更多信息待补充]
源语言生产者
[更多信息待补充]
标注
标注过程
[更多信息待补充]
标注者
[更多信息待补充]
个人和敏感信息
[更多信息待补充]
使用数据的注意事项
数据集的社会影响
[更多信息待补充]
偏见的讨论
[更多信息待补充]
其他已知限制
[更多信息待补充]
附加信息
数据集策展人
[更多信息待补充]
许可信息
Creative Commons Attribution 4.0 License
引用信息
bibtex @article{cocodataset, author = {Tsung{-}Yi Lin and Michael Maire and Serge J. Belongie and Lubomir D. Bourdev and Ross B. Girshick and James Hays and Pietro Perona and Deva Ramanan and Piotr Doll{{a} }r and C. Lawrence Zitnick}, title = {Microsoft {COCO:} Common Objects in Context}, journal = {CoRR}, volume = {abs/1405.0312}, year = {2014}, url = {http://arxiv.org/abs/1405.0312}, archivePrefix = {arXiv}, eprint = {1405.0312}, timestamp = {Mon, 13 Aug 2018 16:48:13 +0200}, biburl = {https://dblp.org/rec/bib/journals/corr/LinMBHPRDZ14}, bibsource = {dblp computer science bibliography, https://dblp.org} }
贡献
感谢 @github-whyen-wang 添加此数据集。




