five

CIRCO|图像检索数据集|基准测试数据集

收藏
github2024-05-09 更新2024-05-31 收录
图像检索
基准测试
下载链接:
https://github.com/miccunifi/CIRCO
下载链接
链接失效反馈
资源简介:
CIRCO是一个基于COCO 2017未标记集的真实世界图像的开域基准数据集,用于组合图像检索(CIR)。它是第一个具有多个真实值的CIR数据集,旨在解决现有数据集中假阴性的问题。CIRCO包含总共1020个查询,随机分为220个验证集和800个测试集,平均每个查询有4.53个真实值。我们使用mAP@K评估CIRCO的性能。

CIRCO is an open-domain benchmark dataset based on the unlabeled set of COCO 2017, designed for compositional image retrieval (CIR). It is the first CIR dataset with multiple ground truths, aiming to address the issue of false negatives in existing datasets. CIRCO contains a total of 1020 queries, randomly divided into a validation set of 220 and a test set of 800, with an average of 4.53 ground truths per query. We evaluate the performance of CIRCO using mAP@K.
创建时间:
2023-03-24
原始信息汇总

CIRCO Dataset 概述

CIRCO (Composed Image Retrieval on Common Objects in context) 是一个基于 COCO 2017 无标签数据集的开放领域基准数据集,专门用于组合图像检索(CIR)。该数据集包含1020个查询,随机分为220个验证集和800个测试集,平均每个查询有4.53个真实标签。CIRCO旨在解决现有数据集中假阴性的问题,并使用mAP@K进行性能评估。

数据集下载

注释

注释文件位于 annotations 文件夹中,每个分割的JSON文件包含相应的注释列表。每个注释包括以下字段:

  • reference_img_id: 参考图像的ID
  • target_img_id: 目标图像的ID
  • relative_caption: 目标图像的相对描述
  • shared_concept: 参考和目标图像之间的共享概念
  • gt_img_ids: 真实标签图像的ID列表
  • id: 查询的ID
  • semantic_aspects: 描述查询的语义方面列表

图像

CIRCO基于COCO 2017无标签数据集的图像。用户需访问COCO网站下载图像及其相应的注释。

数据结构

下载后,数据结构应如下:

CIRCO └─── annotations | test.json | val.json └─── COCO2017_unlabeled └─── annotations | image_info_unlabeled2017.json └─── unlabeled2017 | 000000243611.jpg | 000000535009.jpg | 000000097553.jpg | ...

测试评估服务器

CIRCO测试集的真实标签不公开,而是通过评估服务器进行模型评估。服务器接受JSON格式的提交文件,其中键为查询ID,值为前50个检索到的图像列表。

引用

bibtex @misc{baldrati2023zeroshot, title={Zero-Shot Composed Image Retrieval with Textual Inversion}, author={Alberto Baldrati and Lorenzo Agnolucci and Marco Bertini and Alberto Del Bimbo}, year={2023}, eprint={2303.15247}, archivePrefix={arXiv}, primaryClass={cs.CV} }

AI搜集汇总
数据集介绍
main_image_url
构建方式
CIRCO数据集的构建基于COCO 2017未标注数据集中的真实世界图像,旨在为组合图像检索(CIR)提供一个开放域的基准测试数据集。该数据集通过从COCO 2017未标注集中随机选取图像,并为其生成多个真实标签,以解决现有数据集中假负例的问题。CIRCO包含1020个查询,分为220个验证集和800个测试集,每个查询平均有4.53个真实标签。
使用方法
使用CIRCO数据集时,首先需要克隆GitHub仓库并下载COCO 2017未标注集的图像和注释。数据集的注释文件位于`annotations`文件夹中,每个文件包含查询的详细信息。为了评估模型在测试集上的性能,用户需要通过CIRCO的评估服务器提交预测结果,服务器将返回模型的mAP@K指标。此外,数据集还提供了一些实用脚本,如`dataset.py`和`evaluation.py`,以帮助用户加载数据集和评估模型。
背景与挑战
背景概述
CIRCO数据集(Composed Image Retrieval on Common Objects in context)是由意大利佛罗伦萨大学(University of Florence)的研究团队在2023年ICCV会议上发布的,旨在解决现有组合图像检索(CIR)数据集中存在的假负例问题。该数据集基于COCO 2017未标注集,包含1020个查询,分为220个验证集和800个测试集,平均每个查询有4.53个真实标签。CIRCO的提出不仅为组合图像检索领域提供了一个新的基准,还通过引入多重真实标签,显著提升了检索任务的准确性和鲁棒性。
当前挑战
CIRCO数据集的主要挑战在于其多重真实标签的设计,这要求模型能够更精确地理解图像与文本之间的复杂关系,避免假负例的出现。此外,数据集的构建过程中,研究人员需要从COCO 2017未标注集中筛选出合适的图像,并为其生成详细的注释,这一过程涉及大量的图像处理和语义分析工作。在评估方面,CIRCO通过独立的评估服务器进行测试集的评估,确保了结果的公正性和透明性,但也对模型的预测能力提出了更高的要求。
常用场景
经典使用场景
CIRCO数据集在零样本组合图像检索领域展现了其经典应用场景。该数据集通过提供多重真实标签,解决了现有数据集中假负例的问题,从而为研究者提供了一个更为精确的基准。其核心应用在于通过文本描述检索图像,尤其是在复杂场景中,如通过描述“一只泰迪熊被小女孩抱在椅子上”来检索相关图像。这种应用不仅提升了图像检索的准确性,还为多模态学习提供了丰富的数据支持。
解决学术问题
CIRCO数据集有效解决了组合图像检索中的假负例问题,这是现有数据集普遍面临的挑战。通过引入多重真实标签,CIRCO显著提高了检索任务的准确性和鲁棒性,为零样本学习提供了新的研究方向。此外,该数据集还通过语义分类提供了更细粒度的评估,有助于推动图像与文本多模态理解的研究进展,对计算机视觉领域的学术研究具有重要意义。
实际应用
CIRCO数据集在实际应用中展现了广泛的应用潜力。例如,在电子商务领域,用户可以通过描述商品的特定属性或场景来检索相关产品,从而提升购物体验。在智能安防系统中,CIRCO可以帮助通过描述特定场景或物体来快速检索相关监控图像,提高安全监控的效率。此外,在医疗影像分析中,CIRCO也可用于通过描述病灶特征来检索相关病例,辅助医生进行诊断。
数据集最近研究
最新研究方向
CIRCO数据集作为首个具有多重真实标签的组合图像检索(CIR)基准数据集,近期研究主要聚焦于提升零样本组合图像检索的性能。研究者们通过引入文本反转技术,进一步优化了模型在处理复杂语义关系和多义性问题时的表现。此外,随着2024年扩展版本的发布,研究方向逐渐向语义类别细分的评估方法倾斜,旨在更精确地衡量模型在不同语义层面的检索能力。这一进展不仅推动了CIR领域的技术前沿,也为实际应用中的图像检索系统提供了更为可靠的评估标准。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域地面气象要素驱动数据集 v2.0(1951-2024)

中国区域地面气象要素驱动数据集(China Meteorological Forcing Data,以下简称 CMFD)是为支撑中国区域陆面、水文、生态等领域研究而研发的一套高精度、高分辨率、长时间序列数据产品。本页面发布的 CMFD 2.0 包含了近地面气温、气压、比湿、全风速、向下短波辐射通量、向下长波辐射通量、降水率等气象要素,时间分辨率为 3 小时,水平空间分辨率为 0.1°,时间长度为 74 年(1951~2024 年),覆盖了 70°E~140°E,15°N~55°N 空间范围内的陆地区域。CMFD 2.0 融合了欧洲中期天气预报中心 ERA5 再分析数据与气象台站观测数据,并在辐射、降水数据产品中集成了采用人工智能技术制作的 ISCCP-ITP-CNN 和 TPHiPr 数据产品,其数据精度较 CMFD 的上一代产品有显著提升。 CMFD 历经十余年的发展,其间发布了多个重要版本。2019 年发布的 CMFD 1.6 是完全采用传统数据融合技术制作的最后一个 CMFD 版本,而本次发布的 CMFD 2.0 则是 CMFD 转向人工智能技术制作的首个版本。此版本与 1.6 版具有相同的时空分辨率和基础变量集,但在其它诸多方面存在大幅改进。除集成了采用人工智能技术制作的辐射和降水数据外,在制作 CMFD 2.0 的过程中,研发团队尽可能采用单一来源的再分析数据作为输入并引入气象台站迁址信息,显著缓解了 CMFD 1.6 中因多源数据拼接和气象台站迁址而产生的虚假气候突变。同时,CMFD 2.0 数据的时间长度从 CMFD 1.6 的 40 年大幅扩展到了 74 年,并将继续向后延伸。CMFD 2.0 的网格空间范围虽然与 CMFD 1.6 相同,但其有效数据扩展到了中国之外,能够更好地支持跨境区域研究。为方便用户使用,CMFD 2.0 还在基础变量集之外提供了若干衍生变量,包括近地面相对湿度、雨雪分离降水产品等。此外,CMFD 2.0 摒弃了 CMFD 1.6 中通过 scale_factor 和 add_offset 参数将实型数据化为整型数据的压缩技术,转而直接将实型数据压缩存储于 NetCDF4 格式文件中,从而消除了用户使用数据时进行解压换算的困扰。 本数据集原定版本号为 1.7,但鉴于本数据集从输入数据到研制技术都较上一代数据产品有了大幅的改变,故将其版本号重新定义为 2.0。

国家青藏高原科学数据中心 收录

URPC系列数据集, S-URPC2019, UDD

URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。

github 收录

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

Wind Turbine Data

该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。

www.kaggle.com 收录

BatteryLife

BatteryLife数据集是由香港科技大学(广州)等机构提出的一个全面电池寿命预测数据集。该数据集整合了16个数据集,包含超过90,000个样本,是迄今为止最大的电池寿命数据集。它提供了包括锂离子、锌离子和钠离子电池在内的多种类型电池,覆盖了8种格式、80种化学系统、12种操作温度和646种充放电协议,具有前所未有的多样性。该数据集既包括实验室测试数据,也包括工业测试数据,为电池寿命预测研究提供了丰富的资源。

arXiv 收录