AmsterTime
收藏arXiv2022-06-26 更新2024-06-21 收录
下载链接:
https://github.com/seyrankhademi/AmsterTime
下载链接
链接失效反馈官方服务:
资源简介:
AmsterTime数据集是由代尔夫特理工大学创建,包含2500张精心策划的图像,这些图像匹配了阿姆斯特丹城市的历史档案图像和现代街景图像。数据集通过Mapillary地理信息系统平台直接众包收集,旨在解决视觉地点识别(VPR)中的严重领域转移问题。数据集的创建过程涉及人类专家验证匹配对,确保图像对的准确性。AmsterTime数据集主要用于评估VPR任务中的各种基准模型,包括非学习、监督和自监督方法,特别适用于评估模型在不同视角、光照和外观变化下的性能。
The AmsterTime Dataset was created by Delft University of Technology. It consists of 2500 carefully curated images, which are matched pairs of historical archival images and modern street view images of Amsterdam. The dataset was directly crowdsourced via the Mapillary geographic information system platform, with the aim of addressing the severe domain shift problem in Visual Place Recognition (VPR). During its construction, human experts were engaged to validate all matched image pairs to ensure their accuracy. The AmsterTime Dataset is primarily utilized to evaluate various benchmark models for VPR tasks, including non-learning, supervised, and self-supervised approaches, and it is particularly suitable for assessing model performance under diverse variations in viewpoints, lighting conditions, and scene appearances.
提供机构:
代尔夫特理工大学
创建时间:
2022-03-30
搜集汇总
数据集介绍

构建方式
在视觉地点识别领域,构建能够应对严重领域偏移的基准数据集至关重要。AmsterTime数据集的构建采用了创新的众包策略,通过定制化的网络应用程序,将来自阿姆斯特丹城市档案馆的历史档案图像与Mapillary平台上的街景图像进行匹配。参与者利用地理信息系统导航工具,在三维街景中寻找与档案图像对应的同一地点,随后所有匹配结果均由建筑历史学家和当地居民进行人工验证,确保了图像对的准确性与可靠性。这一过程最终产生了1231对经过精心筛选的图像,涵盖了同一地点在不同时间、视角、光照及相机设备下的视觉表现,形成了包含约2500张图像的高质量数据集。
特点
AmsterTime数据集的核心特点在于其引入了显著的领域偏移挑战,为视觉地点识别任务提供了独特的评估基准。该数据集包含档案图像与当代街景图像的配对,两者在时间跨度上跨越百年,呈现出扫描档案与数字街景之间的本质差异,如结构变化、遮挡、视角变换及色彩失真等。与现有基于车辆轨迹或社交媒体的数据集不同,AmsterTime直接通过众包方式获取视觉上真正相似的地点匹配,避免了地理信息系统标注中常见的视觉不一致问题。此外,数据集规模虽有限,却精准聚焦于评估而非训练,强调了数据稀缺性下的模型泛化能力,并通过t-SNE可视化展现了图像在特征空间中的复杂分布。
使用方法
AmsterTime数据集主要用于视觉地点识别任务的基准测试,支持验证和检索两种核心评估模式。在验证任务中,数据集提供正负样本对,用于二元分类,以判断图像对是否描绘同一地点;检索任务则遵循标准的内容基图像检索流程,以档案图像作为查询,在街景图像库中寻找最相似匹配。研究人员可提取图像特征,利用余弦距离等度量计算相似度,并采用平均精度均值、Top1和Top5准确率等指标进行评估。数据集已用于测试多种基线模型,包括传统局部特征、预训练卷积神经网络及自监督学习方法,同时通过Grad-CAM可视化技术深入分析模型所学特征,为领域偏移下的表示学习提供了可解释性洞察。
背景与挑战
背景概述
视觉地点识别作为计算机视觉领域的关键研究方向,致力于通过单张图像推断其地理定位,在机器人导航、消费摄影及数字档案管理等方面具有广泛应用。传统数据集多依赖地理信息系统标注或社交媒体图像采集,存在视觉相似性不足或地理热点偏差等局限。为此,荷兰代尔夫特理工大学与阿姆斯特丹自由大学的研究团队于2022年联合推出了AmsterTime数据集,旨在构建一个在严重域偏移环境下评估视觉地点识别模型的基准。该数据集包含约2500张经过精心筛选的图像对,每对由历史档案图像与当代街景图像组成,全部通过Mapillary平台众包采集并经专家验证,捕捉了同一地点在不同时空维度下的巨大外观差异。
当前挑战
AmsterTime数据集所针对的视觉地点识别任务,核心挑战在于克服查询图像与库图像之间的严重域偏移,这种偏移源于历史档案图像与当代街景在拍摄传感器、视角、光照、结构变化及色彩表现等方面的根本性差异。构建过程中的挑战则体现在众包标注的复杂性上:需开发定制化GIS集成工具以实现精确的地理位置匹配,并依赖建筑历史学者与当地居民进行人工验证,确保每对图像在视觉上真实对应同一地点,同时避免自动化标注中常见的视觉不一致性问题。
常用场景
经典使用场景
在视觉地点识别领域,AmsterTime数据集被广泛用于评估模型在极端域偏移下的鲁棒性。该数据集通过精心匹配阿姆斯特丹城市的历史档案图像与当代街景图像,构建了包含不同相机、视角和外观的图像对,为研究者提供了一个模拟真实世界复杂变化的基准平台。其经典使用场景包括验证和检索任务,其中模型需在历史查询图像与街景图库间进行精确匹配,以测试跨域视觉相似性学习的有效性。
解决学术问题
AmsterTime数据集主要解决了视觉地点识别中因时间跨度、传感器差异和场景变化导致的域偏移问题。传统数据集往往依赖地理信息系统标注或社交媒体图像,存在视觉相似性不足或偏差较大的局限。该数据集通过众包方式确保图像对基于人类视觉匹配,提供了更可靠的评估基准,促进了跨域表示学习、自监督相似性学习等方向的研究,并为模型在历史档案数字化、城市变迁分析等应用中的性能提升提供了理论支撑。
衍生相关工作
基于AmsterTime数据集,研究者衍生出多项经典工作,主要集中在自监督学习和视觉解释领域。例如,采用SimSiam框架探索无负样本对的相似性学习,提升了模型在数据稀缺场景下的表现;利用Grad-CAM技术可视化模型注意力机制,揭示了跨域特征学习的可解释性。这些工作不仅推动了视觉地点识别模型的创新,还为域适应、小样本学习等更广泛的计算机视觉课题提供了方法论借鉴。
以上内容由遇见数据集搜集并总结生成



