ilias-core

Hugging Face2025-03-10 更新2025-03-11 收录

下载链接：

https://huggingface.co/datasets/stojnvla/ilias-core

下载链接

链接失效反馈

官方服务：

资源简介：

ILIAS是一个用于大规模实例级图像检索评估的大规模测试数据集。它包括1000个跨不同领域的对象实例，共有5947张图像，其中包括1232张查询图像和4715张正例图像。此外，还有1000个提供查询对象精细文本描述的文本查询。数据集还包括来自YFCC100M的1亿个干扰项，用于在大规模设置下评估检索性能。这个存储库只包含ILIAS核心数据集，即5947张图像和1000个文本查询。

ILIAS is a large-scale test dataset dedicated to large-scale instance-level image retrieval evaluation. It encompasses 1000 object instances across various domains, with a total of 5947 images, consisting of 1232 query images and 4715 positive sample images. Additionally, the complete dataset provides 1000 text queries, each containing a fine-grained textual description of the corresponding query object. The full dataset also includes 100 million distractor samples sourced from YFCC100M, which enables retrieval performance evaluation under large-scale scenarios. This repository solely contains the core subset of ILIAS, namely the 5947 images and 1000 text queries.

创建时间：

2025-02-24

搜集汇总

数据集介绍

构建方式

ILIAS数据集的构建，以大规模图像检索评估为宗旨，涵盖了1000个对象实例的跨领域数据。具体包括5947张图像，其中1232张作为图像查询，4715张作为正样本，以及1000个文本查询。这些数据是在确保真实世界条件下，对象具有杂乱、遮挡、尺寸变化和部分视角等特点的情况下精心挑选的，旨在为视觉和视觉语言模型的表征提供评估基准。

特点

ILIAS数据集的特点在于其专注于实例级图像检索的大规模测试。它不仅包含了清晰背景下的查询对象图像，还提供了相应的细粒度文本描述，以及来自YFCC100M的1亿个干扰项，用于在大规模设置下评估检索性能，同时保证了地面真实数据的无噪声。

使用方法

使用ILIAS数据集，用户首先需要通过HuggingFace的datasets库进行安装和加载。加载后，用户可以根据需要选择图像查询、文本查询或核心数据库的任意一部分。对于完整的数据集使用，用户还需按照GitHub上的说明下载YFCC100M的干扰项数据集。

背景与挑战

背景概述

ILIAS数据集，全称为Instance-Level Image retrieval At Scale，是一个大规模的测试数据集，旨在评估实例级图像检索的性能。该数据集由ILIAS团队收集整理，并于2025年发布，主要针对图像到图像以及文本到图像的检索研究，为特定对象的检索提供支持，并作为评估基础或定制视觉以及视觉语言模型表征的基准。ILIAS数据集的构建，对图像检索领域的研究产生了重要影响，为相关领域的技术发展提供了有力支撑。

当前挑战

ILIAS数据集在研究领域中面临的挑战主要包括：一是如何在大规模设置下，特别是在含有大量干扰项的情况下，保证检索性能的准确性和效率；二是如何在现实世界的复杂背景下，处理对象的遮挡、尺度变化和部分视角等问题。此外，构建此类数据集的过程也面临着如何在保持数据质量的同时，有效管理和组织大规模数据集的挑战。

常用场景

经典使用场景

ILIAS数据集作为大规模实例级图像检索评估的测试数据集，其经典使用场景在于图像到图像(image-to-image)以及文本到图像(text-to-image)的特定对象检索。研究人员可通过该数据集对基础或定制化的视觉及视觉语言模型的表现进行评估，同时针对专门的检索技术进行基准测试。

衍生相关工作

ILIAS数据集的发布促进了相关领域的研究，衍生出了一系列经典工作，如针对不同视觉任务的特征提取、检索算法的改进、以及视觉语言模型的融合策略等，推动了图像检索技术的进步和创新发展。

数据集最近研究