ILIAS

github2025-02-28 更新2025-02-24 收录

下载链接：

https://github.com/ilias-vrg/ilias

下载链接

链接失效反馈

官方服务：

资源简介：

ILIAS是一个大规模的测试数据集，用于在实例级图像检索领域进行评估。它旨在支持针对特定对象进行图像到图像和文本到图像检索的未来研究，并作为评估基础或定制化视觉和视觉语言模型表示以及专门检索技术的基准。

ILIAS is a large-scale test dataset designed for evaluation in the field of instance-level image retrieval. It aims to support future research on object-specific image-to-image and text-to-image retrieval, and serve as a benchmark for evaluating foundational or customized visual and vision-language model representations as well as specialized retrieval techniques.

创建时间：

2025-02-11

原始信息汇总

ILIAS 数据集概述

数据集简介

名称：ILIAS (Instance-Level Image retrieval At Scale)
用途：用于评估大规模实例级图像检索的数据集，支持图像到图像和文本到图像的特定对象检索研究。
目标：作为评估基础和定制视觉及视觉语言模型表示以及专门检索技术的基准。

数据集组成

对象实例：1,000个跨领域对象实例
图像数据：
- 总图像数：5,947张
- 查询图像：1,232张，展示在干净或统一背景上的查询对象
- 正样本图像：4,715张，展示在真实世界条件下的查询对象（包含杂乱、遮挡、尺度变化和部分视图）
文本查询：1,000条，提供查询对象的细粒度文本描述
干扰项：来自YFCC100M的100M干扰项，用于评估大规模设置下的检索性能

使用说明

下载：可通过指定链接下载数据集
其他功能：特征提取、kNN搜索、评估、局部表示重排序、线性适配（即将推出）

引用

bibtex @inproceedings{ilias2025, title={{ILIAS}: Instance-Level Image retrieval At Scale}, author={Kordopatis-Zilos, Giorgos and Stojnić, Vladan and Manko, Anna and Šuma, Pavel and Ypsilantis, Nikolaos-Antonios and Efthymiadis, Nikos and Laskar, Zakaria and Matas, Jiří and Chum, Ondřej and Tolias, Giorgos}, booktitle={Computer Vision and Pattern Recognition (CVPR)}, year={2025}, }

许可证

代码许可证：MIT License

联系方式

联系人：Giorgos Kordopatis-Zilos
邮箱：kordogeo@fel.cvut.cz

搜集汇总

数据集介绍

构建方式

ILIAS数据集的构建汇集了1,000个对象实例，跨越多个领域。该数据集包含5,947张图像，其中包括1,232张作为查询用的图像以及4,715张在现实条件下展示查询对象的各种情况的正样本图像。此外，还包括1,000个细粒度的文本查询，以及来自YFCC100M的1亿个干扰项，用于在大规模设置下评估检索性能，同时确保了无噪声的地面真实数据。

特点

ILIAS数据集的特点在于其大规模的实例级图像检索评估功能，支持图像到图像和文本到图像的特定对象检索研究。它为评估基础或定制化视觉和视觉语言模型的表征，以及专用检索技术提供了一个基准。数据集的构成充分考虑了现实世界的复杂性，包括对象的遮挡、尺寸变化和部分视角等。

使用方法

使用ILIAS数据集，用户可以通过提供的链接下载数据集和相关代码。虽然一些功能如特征提取、kNN搜索、评估、局部表示的重排和线性适应目前尚未提供，但用户可以期待未来这些功能的实现。在使用ILIAS数据集进行研究时，应遵循MIT许可证的规定，并在研究中引用相关论文。

背景与挑战

背景概述

ILIAS数据集，全称为Instance-Level Image retrieval At Scale，是一个大规模的测试数据集，旨在评估图像检索技术在实例级别的大规模图像检索中的性能。该数据集由Giorgos Kordopatis-Zilos等研究人员于2025年创建，并发表于arXiv。ILIAS数据集包含了1000个对象实例，跨越多个领域，旨在支持图像到图像和文本到图像的检索研究，并为评估基础或定制化的视觉及视觉语言模型表示以及专门的检索技术提供了一个基准。该数据集对于图像检索领域的研究具有重大影响，为相关技术的评估和进展提供了重要资源。

当前挑战

ILIAS数据集在构建过程中面临的挑战主要包括：如何在大规模设置下评估检索性能，确保在包含大量干扰项的环境中保持检索的准确性；如何在真实世界条件下处理对象的遮挡、尺度变化和部分视角等问题，以实现有效的图像检索；以及如何在数据集中整合高质量的图像和文本查询，以提供精细化的文本描述。此外，数据集的构建还需解决如何在保持 ground truth 无噪声的同时，从YFCC100M中选取100M的干扰项这一挑战。

常用场景

经典使用场景

ILIAS数据集作为大规模图像检索评估的基准，其经典使用场景在于对特定对象进行图像到图像以及文本到图像的检索。该数据集能够支撑研究人员对基础或定制化视觉及视觉语言模型的表现进行评估，并对专门的检索技术进行验证。

实际应用

在实际应用中，ILIAS数据集可用于提升图像识别与检索系统的准确性，例如在图像搜索引擎中快速定位相似图像，或者在电子商务平台中帮助用户通过图片或文本描述找到商品。

衍生相关工作

ILIAS数据集的推出催生了众多相关工作，包括对数据集本身的扩展、基于该数据集的模型训练与优化方法研究，以及针对特定应用场景的检索技术改进等，为图像检索领域的研究提供了丰富的资源和方向。

以上内容由遇见数据集搜集并总结生成