five

revisitop

收藏
Hugging Face2025-07-15 更新2025-07-15 收录
下载链接:
https://huggingface.co/datasets/randall-lab/revisitop
下载链接
链接失效反馈
官方服务:
资源简介:
RevisitOP是一个提供用于大规模图像检索研究的流行基准数据集,包括roxford5k、rparis6k、revisitop1m和oxfordparis四个子数据集。这些数据集包含现实世界的建筑照片和干扰项,广泛用于评估图像检索算法。

RevisitOP is a popular benchmark dataset for large-scale image retrieval research, comprising four sub-datasets: roxford5k, rparis6k, revisitop1m, and oxfordparis. These datasets contain real-world architectural photographs and distractor samples, and are widely used to evaluate image retrieval algorithms.
创建时间:
2025-07-02
搜集汇总
数据集介绍
main_image_url
构建方式
RevisitOP数据集作为图像检索领域的重要基准,其构建过程体现了严谨的学术规范。该数据集整合了牛津5K建筑图像和巴黎6K建筑图像,通过官方渠道下载并提取原始图像文件,辅以精心标注的真值文件。真值文件采用.pkl格式存储,包含查询图像列表、数据库图像列表以及详细的边界框坐标与相关性标注。百万级干扰图像集则通过100个.tar.gz压缩包系统化组织,确保数据源的可靠性与完整性。
特点
该数据集的核心特征在于其多层次标注体系与真实场景的紧密结合。每个样本不仅包含图像文件和原始文件名,还精确标注了查询ID、边界框坐标以及三类相关性标签:简单匹配、困难匹配和干扰项。这种细粒度的标注方式为评估算法在不同难度层级上的性能提供了坚实基础。数据集特别区分查询图像与数据库图像,并融合了建筑摄影的专业性与大规模干扰集的挑战性。
使用方法
研究者可通过Hugging Face数据集库灵活加载不同配置,分别调用查询集与数据库集进行算法验证。加载时需指定数据集名称与分割类型,查询集包含带标注的查询图像及其真值信息,数据库集则提供待检索的图像集合。为避免大规模数据加载超时,建议配置延长超时参数。典型使用流程包括加载数据、提取查询示例并基于边界框与相关性标签进行检索精度评估。
背景与挑战
背景概述
RevisitOP数据集由捷克技术大学计算机视觉研究团队于2018年创建,旨在重构传统图像检索基准数据集Oxford5k和Paris6k的标注体系。该数据集通过引入精细化查询边界框标注与多层级相关度评估标准,解决了建筑图像检索中因视角变化和遮挡导致的评估偏差问题,成为图像检索领域权威性能基准,推动了深度特征匹配算法的发展。
当前挑战
数据集核心挑战在于解决复杂场景下的建筑图像检索问题,包括跨视角匹配、局部特征对应和光照条件变化等难题。构建过程中需处理原始数据标注不一致性,通过人工校验重新定义查询区域边界,并设计百万级干扰图像库以模拟真实检索环境,其大规模分布式存储架构对数据托管与访问效率提出极高要求。
常用场景
经典使用场景
在图像检索领域,RevisitOP数据集作为基准测试集广泛应用于算法性能评估。其经典使用场景包括通过roxford5k和rparis6k的建筑图像集合,模拟真实环境下的地标检索任务。研究者通常将查询图像与数据库中的百万级干扰图像进行匹配,测试模型在复杂场景中的检索精度与鲁棒性。这种标准化评估流程为图像检索算法的横向比较提供了可靠平台。
衍生相关工作
基于RevisitOP数据集衍生出众多经典研究工作,包括深度局部特征学习方法(如DELF、R2D2)、注意力机制增强的检索模型,以及针对困难样本的度量学习策略。该数据集还催生了多模态检索系统的研究,例如结合文本描述的建筑图像检索。这些工作不仅推动了图像检索技术的发展,更为计算机视觉领域提供了可复现的基准框架。
数据集最近研究
最新研究方向
在图像检索领域,RevisitOP数据集持续推动着大规模实例检索算法的创新突破。当前研究聚焦于跨模态检索与自监督学习的深度融合,通过视觉-语言预训练模型实现无需人工标注的跨域特征对齐。随着Transformer架构在视觉任务中的广泛应用,基于注意力机制的多尺度特征融合方法显著提升了复杂场景下的检索精度。该数据集已成为评估地理定位系统和自动驾驶环境感知能力的重要基准,其构建的百万级干扰图像库为对抗性样本鲁棒性研究提供了关键支撑。最新进展表明,结合神经辐射场(NeRF)的三维场景重建技术与图像检索任务正形成协同效应,为数字孪生城市构建提供新的技术路径。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作