fansel/nordland
收藏Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/fansel/nordland
下载链接
链接失效反馈官方服务:
资源简介:
Nordland数据集(Olid等人分区版)是经过预处理和分区的Nordland数据集版本,用于研究季节性变化下的单视图地点识别。数据集来源于挪威广播公司(NRK)的视频,包含四个季节(春、夏、秋、冬)的图像,每秒钟提取一帧,过滤掉隧道和火车停靠点,共28,865张图像/季节。数据集分为训练集和测试集,训练集包含两个部分(12,837和11,733张图像),测试集包含三个部分(每部分1,150张图像)。每个样本包含图像(PNG格式)、季节、帧ID(相同帧ID表示相同地理位置)和部分信息(训练或测试部分)。
The Nordland Dataset (Olid et al. Partition) is a pre-processed and partitioned version of the Nordland Dataset, designed for single-view place recognition under seasonal changes. The dataset is derived from videos by the Norwegian Broadcasting Corporation (NRK) and includes images from four seasons (fall, spring, summer, winter), with one frame extracted per second. Tunnels and train stops were filtered out, resulting in 28,865 images per season. The dataset is split into training and test sets: the training set consists of two sections (12,837 and 11,733 images), and the test set consists of three sections (1,150 images each). Each sample contains an image (PNG format), season, frame ID (same frame ID indicates the same geographic location), and section information (train or test sections).
提供机构:
fansel
搜集汇总
数据集介绍

构建方式
Nordland数据集源自挪威广播公司拍摄的《Nordlandsbanen: minute by minute, season by season》视频素材,四位景观皆被纳入采集范围。数据构建由Daniel Olid等研究者执行,以每秒一帧的频率从原始视频中提取图像,并过滤隧道与列车停靠站片段,最终每个季节保留28,865帧图像。随后依据地理连续性将数据划分为五个区间:两个训练区段与三个测试区段,每个区段间通过丢弃200帧图像以消除地理重叠,确保训练与测试集合代表截然不同的空间位置。
特点
该数据集的核心特色在于其跨季节场景识别能力,同一帧索引对应四个季节中完全相同的地理位置,为季节变化环境下的视觉位置识别研究提供了天然基准。数据格式简洁清晰,每条样本包含PNG图像、季节标签、全局帧索引及区段标签。图像间距离介于1米至25米之间,采样密集且分布均匀,能良好模拟列车行进过程中的连续视觉反馈,适用于鲁棒特征学习与域适应方法评估。
使用方法
数据集可通过HuggingFace Datasets库便捷加载,使用load_dataset('fansel/nordland')命令即可获取训练和测试拆分。由于季节与区段标签以ClassLabel形式存储,建议先通过cast_column方法将其转换为字符串类型,以便进行自然过滤。用户可基于季节字段筛选出特定季节的子集(如冬季测试集),亦可针对区段字段提取指定训练或测试区段。利用frame_id的一致性特性,可轻松实现跨季节的正样本匹配,支撑图片对构建与度量学习任务。
背景与挑战
背景概述
Nordland数据集由萨拉戈萨大学的Daniel Olid、José M. Facil和Javier Civera于2018年创建,基于挪威广播公司拍摄的《Nordlandsbanen: minute by minute, season by season》视频素材,经过精心预处理与划分得到。该数据集聚焦于视觉地点识别(Visual Place Recognition, VPR)领域中的季节性变化问题,其核心研究在于评估单视角图像在历经春、夏、秋、冬四季剧烈外观变迁下的地点匹配能力。作为研究季节鲁棒性的重要基准,Nordland数据集推动了场景理解与长期视觉定位技术的发展,在机器人导航、自动驾驶等领域具有广泛影响力。
当前挑战
该数据集面临的核心领域挑战是视觉地点识别中的季节性变化问题:同一地理位置在不同季节呈现出截然不同的外观(如植被枯荣、积雪覆盖与光照变化),导致传统基于视觉特征的匹配方法性能急剧下降。构建过程中,团队需从原始长达数小时的铁路视频中逐秒提取关键帧,并手动过滤隧道、车站停车等无效片段,确保每帧间地理间距在1至25米之间。此外,还需精心划分训练与测试区域,保证地理不重复性,以公平评估算法在未见地点的泛化能力,这增加了数据处理的工程复杂度。
常用场景
经典使用场景
Nordland数据集是视觉地点识别(Visual Place Recognition, VPR)领域中最具代表性的跨季节匹配基准之一。该数据集源于挪威广播公司拍摄的《Nordlandsbanen》四季行车记录视频,经过每秒抽取一帧、滤除隧道和停靠站等预处理后,保留了每季节28665张地理对齐的图像。其经典的使用场景是基于单一视角图像,在四季剧烈变化(如落叶、积雪、植被更替)的条件下,检索出同一地理位置在不同季节中的对应图像。研究者通常利用其精心划分的训练集与测试集分区(共5个路段),在确保不同区段地理位置互斥的前提下,评估模型在光照、色彩、纹理和语义内容显著变化的真实环境中的鲁棒性与泛化能力。
解决学术问题
Nordland数据集的提出,核心解决了长期视觉地点识别中跨季节外观剧变带来的匹配失效难题。传统基于局部特征或全局描述子的方法在面对冬季积雪掩埋、秋季落叶覆盖、春夏植被疯长等极端场景时,性能急剧下降。该数据集通过提供严格地理对齐的四季节图像对,为学界系统量化光照不变性描述子、语义保留特征学习和域适应方法等提供了标准评测平台。其深远意义在于推动了从手工设计特征(如SIFT、HOG)到基于深度学习的特征表示(如NetVLAD、CosFace)的范式转变,并催生了大量致力于季节不变性、域泛化和长期环境理解的研究工作,显著提升了机器人在复杂动态场景下进行可靠地点识别与导航的学术基础。
衍生相关工作
基于Nordland数据集,学术界衍生出了一系列推动视觉地点识别发展的经典工作。Olid等人(2018)在其原始论文中,利用该数据集系统比较了多种全局与局部图像描述子在季节变化下的匹配性能,并首次提出将场景分割与语义信息引入地点识别以提升跨季节鲁棒性。此后,NetVLAD、DenseVLAD等基于聚合局部特征的学习方法,以及SuperPoint、D2-Net等深度局部特征描述子,均将Nordland作为核心评估基准之一。近年来,Transformer架构如ConvNeXt、DINOv2以及结合全局与局部特征的双流网络(如SelaVPR、MixVPR)也在该数据集上验证了其跨季节泛化能力。这些工作共同推动了VPR领域从特定场景描述向通用、鲁棒的地点推理模型迈进。
以上内容由遇见数据集搜集并总结生成



