HYPSO-1 Sea-Land-Cloud-Labeled Dataset
收藏arXiv2023-09-04 更新2024-06-21 收录
下载链接:
https://ntnu-smallsat-lab.github.io/hypso1_sea_land_clouds_dataset/
下载链接
链接失效反馈官方服务:
资源简介:
HYPSO-1 Sea-Land-Cloud-Labeled Dataset是由挪威科技大学创建的开放数据集,包含200张多样化的超光谱图像,用于地球观测科学研究。数据集大小为131百万个光谱签名,涵盖了从原始到校准的不同形式。创建过程中,使用了推扫式扫描技术,并进行了光谱和辐射校准。该数据集主要应用于海洋学研究,特别是监测和预测海洋事件,如有害藻华,同时也支持超分辨率、异常检测、图像融合和分类等多种应用。
HYPSO-1 Sea-Land-Cloud-Labeled Dataset is an open dataset developed by the Norwegian University of Science and Technology. It contains 200 diverse hyperspectral images for Earth observation scientific research, with a total of 131 million spectral signatures covering formats ranging from raw to calibrated. The dataset was constructed using pushbroom scanning technology and underwent spectral and radiative calibration. It is primarily applied in oceanographic research, particularly for monitoring and forecasting marine events such as harmful algal blooms, and also supports a wide range of applications including super-resolution, anomaly detection, image fusion and classification.
提供机构:
挪威科技大学
创建时间:
2023-08-26
搜集汇总
数据集介绍

构建方式
在遥感领域,高光谱成像技术因其丰富的光谱信息而备受关注,但标注数据的稀缺制约了相关模型的训练。HYPSO-1海陆云标注数据集的构建依托于HYPSO-1卫星任务,该卫星采用推扫式扫描技术,通过684像素狭缝传感器阵列采集数据,生成空间分辨率约为100米×600米、包含120个光谱通道(400至800纳米波长范围)的数据立方体。研究团队从2022年6月至2023年3月期间捕获的千余幅图像中,依据元数据完整性和场景多样性原则,精选了200幅涵盖全球各大洲海岸线、内陆水体及多种地貌的高光谱图像。其中38幅图像通过半自动像素级标注流程,利用ENVI分割工具结合机器学习算法(如最大似然法、马氏距离法),辅以人工专家修正,生成了约2500万个海、陆、云类别的光谱标签,确保了标注的精确性与可靠性。
特点
该数据集的核心特点在于其多样性与开放性。图像内容覆盖全球不同地理区域,包括海岸带、湖泊、森林、极地及城市景观,展现了水体颜色从深蓝到浅绿的光谱变异,以及云层密度和光照条件的广泛分布。数据集提供原始数字信号与经辐射定标后的物理值两种格式,便于多角度科学分析。标注子集包含海、陆、云三类像素级标签,类别分布均衡(水体37.01%、陆地40.14%、云层22.85%),为模型训练提供了丰富的地面真值。此外,数据集还附带了优化的1D全卷积网络模型与开源代码,支持分类、超分辨率、异常检测等多种高光谱处理任务,显著提升了数据集的实用价值与研究深度。
使用方法
研究人员可通过公开网站获取数据集的全部资源,包括原始与校准图像、标注标签、预训练模型及Python示例代码。使用前需依据研究目标选择数据格式:原始数字信号适用于传感器特性分析,而辐射定标数据则更适合物理模型反演与定量遥感应用。对于分类任务,可直接利用标注子集训练或验证深度学习模型,如附带的1D全卷积网络,该模型在测试中展现出高达0.95的整体准确率。数据集亦支持跨领域研究,如通过光谱特征分析水体藻华事件或陆地植被健康状况,其多样场景设计有助于模型泛化能力评估。开放许可确保了数据在学术与工程应用中的广泛共享与二次开发。
背景与挑战
背景概述
高光谱成像技术作为遥感领域的前沿手段,能够通过连续窄波段捕获地物的精细光谱特征,为地球与海洋观测提供关键数据支撑。然而,长期以来,高光谱影像的标注数据集稀缺,制约了依赖地面实况数据的人工智能模型训练。在此背景下,挪威科技大学等机构的研究团队于2023年发布了HYPSO-1海陆云标注数据集,该数据集源自2022年发射的HYPSO-1立方卫星任务,包含200幅覆盖全球多样场景的高光谱影像,其中38幅具有像素级海、陆、云类别标注,总计约2500万个标注光谱签名。这一数据集的推出,旨在解决遥感领域中标注数据不足的核心瓶颈,为高光谱分类、超分辨率及异常检测等任务提供重要资源,推动地球与海洋观测研究的深化发展。
当前挑战
在高光谱遥感领域,海陆云分类任务面临诸多挑战:首先,由于海洋、陆地及云层的光谱特征在不同环境条件下呈现高度变异性,例如水体颜色受藻类生物量、悬浮物及海底反射影响而显著变化,云层的光谱特征则因水滴尺寸与厚度差异而复杂多样,这导致模型需具备强大的泛化能力以应对复杂场景。其次,数据构建过程中,标注工作依赖半自动流程与人工修正,尤其在类别边界处(如海岸线、云层边缘)的精确划分极为困难,易受传感器过饱和像素及条纹伪影干扰。此外,现有标注数据集中云与冰雪等相似地物的光谱混淆问题尚未完全解决,限制了模型在极区等特殊环境下的应用效果。
常用场景
经典使用场景
在遥感与地球观测领域,高光谱成像技术凭借其丰富的光谱信息,为地表与海洋环境的精细分类提供了独特优势。HYPSO-1海陆云标记数据集作为首个公开的HYPSO-1卫星标注数据,其经典使用场景集中于海陆云像素级分类任务。该数据集通过提供38幅标注图像,涵盖约2500万个光谱签名,为训练深度学习模型提供了高质量的监督信号。研究者可基于这些标注数据,开发高效的分类算法,以区分海洋、陆地及云层覆盖区域,从而支持后续的海洋监测与环境分析。
解决学术问题
高光谱遥感研究中,标注数据的稀缺长期制约着监督学习模型的训练与泛化能力。HYPSO-1海陆云标记数据集有效缓解了这一瓶颈,为学术界提供了大规模、多样化的标注高光谱图像。该数据集不仅解决了传统数据集(如AVIRIS、ROSIS)仅含单幅标注图像、覆盖范围有限的问题,还通过涵盖全球不同地域的场景,增强了模型对复杂环境的适应能力。其意义在于推动了高光谱分类方法的发展,为海洋有害藻华监测、海岸带变化分析等研究提供了可靠的数据基础,促进了地球观测与遥感科学的进步。
衍生相关工作
基于HYPSO-1海陆云标记数据集,已衍生出多项经典研究工作。例如,论文中提出的优化一维全卷积网络(1D FCN)模型,在海水、陆地与云层分类任务中取得了优于现有方法的性能,为高光谱像素级分类设立了新基准。该数据集还激发了后续研究,包括超分辨率重建、异常检测、图像融合等多类高光谱处理任务。此外,其开放获取策略促进了全球研究者的协作,催生了针对特定地域(如极地、内陆水域)的专项分析,进一步拓展了高光谱遥感在环境科学与工程中的应用边界。
以上内容由遇见数据集搜集并总结生成



