CIRCO
收藏CIRCO Dataset 概述
CIRCO (Composed Image Retrieval on Common Objects in context) 是一个基于 COCO 2017 无标签数据集的开放领域基准数据集,专门用于组合图像检索(CIR)。该数据集包含1020个查询,随机分为220个验证集和800个测试集,平均每个查询有4.53个真实标签。CIRCO旨在解决现有数据集中假阴性的问题,并使用mAP@K进行性能评估。
数据集下载
注释
注释文件位于 annotations 文件夹中,每个分割的JSON文件包含相应的注释列表。每个注释包括以下字段:
reference_img_id: 参考图像的IDtarget_img_id: 目标图像的IDrelative_caption: 目标图像的相对描述shared_concept: 参考和目标图像之间的共享概念gt_img_ids: 真实标签图像的ID列表id: 查询的IDsemantic_aspects: 描述查询的语义方面列表
图像
CIRCO基于COCO 2017无标签数据集的图像。用户需访问COCO网站下载图像及其相应的注释。
数据结构
下载后,数据结构应如下:
CIRCO └─── annotations | test.json | val.json └─── COCO2017_unlabeled └─── annotations | image_info_unlabeled2017.json └─── unlabeled2017 | 000000243611.jpg | 000000535009.jpg | 000000097553.jpg | ...
测试评估服务器
CIRCO测试集的真实标签不公开,而是通过评估服务器进行模型评估。服务器接受JSON格式的提交文件,其中键为查询ID,值为前50个检索到的图像列表。
引用
bibtex @misc{baldrati2023zeroshot, title={Zero-Shot Composed Image Retrieval with Textual Inversion}, author={Alberto Baldrati and Lorenzo Agnolucci and Marco Bertini and Alberto Del Bimbo}, year={2023}, eprint={2303.15247}, archivePrefix={arXiv}, primaryClass={cs.CV} }




