five

HyperGlobal-450K - 全球最大规模高光谱图像数据集|高光谱图像数据集|遥感技术数据集

收藏
github2024-06-19 更新2024-06-19 收录
高光谱图像
遥感技术
下载链接:
https://github.com/WHU-Sigma/HyperSIGMA
下载链接
链接失效反馈
资源简介:
HyperGlobal-450K数据集由武汉大学联合国内外多所知名高校及研究机构共同构建,是迄今为止全球规模最大的高光谱图像数据集。该数据集包含约45万张高光谱图像,规模等价于超过2000万张不重叠的三波段图像,远超现有的同类数据集。数据集涵盖了全球范围内的高光谱遥感图像,包括来自地球观测一号(EO-1)Hyperion和高分五号(GF-5B)两种传感器的图像,光谱范围从可见光到短波及中波红外,具有从紫外到长波红外的330个光谱波段,空间分辨率为30米。每幅图像经过精心处理,去除了无效波段和水汽吸收波段,保留了具有实际应用价值的光谱信息。HyperGlobal-450K数据集不仅支持高光谱图像的基础研究,还能够用于开发和测试各种高光谱图像处理方法,比如图像分类、目标检测、异常检测、变化检测、光谱解混、图像去噪和超分辨率等任务。

The HyperGlobal-450K dataset, collaboratively developed by Wuhan University along with several renowned domestic and international universities and research institutions, represents the largest hyperspectral image dataset globally to date. This dataset comprises approximately 450,000 hyperspectral images, equivalent to over 20 million non-overlapping three-band images, significantly surpassing existing datasets of its kind. It encompasses hyperspectral remote sensing images from across the globe, including those captured by the Earth Observing-1 (EO-1) Hyperion and Gaofen-5B (GF-5B) sensors. The spectral range extends from visible light to shortwave and midwave infrared, featuring 330 spectral bands from ultraviolet to longwave infrared, with a spatial resolution of 30 meters. Each image has been meticulously processed to remove invalid bands and water vapor absorption bands, retaining spectral information of practical application value. The HyperGlobal-450K dataset not only supports fundamental research in hyperspectral imaging but also facilitates the development and testing of various hyperspectral image processing methods, such as image classification, target detection, anomaly detection, change detection, spectral unmixing, image denoising, and super-resolution tasks.
提供机构:
武汉大学、重庆大学、东京大学等
创建时间:
2024-06-17
原始信息汇总

数据集概述

数据集名称

HyperGlobal-450K

数据集描述

HyperGlobal-450K 是一个大规模的 hyperspectral 数据集,用于训练基础模型。该数据集包含超过2000万张三波段图像,远超现有 hyperspectral 数据集的规模。

数据集内容

  • 包含1,701张图像,其中1,486张来自EO-1卫星,215张来自GF-5B卫星。
  • 每张图像包含数百个光谱波段。

数据集分布

  • 数据集样本来自全球各地。

数据集用途

  • 用于训练和验证 HyperSIGMA 模型,该模型是一个专为 HSI 解释设计的亿级基础模型。

数据集相关模型

  • HyperSIGMA:该模型通过引入稀疏采样注意力(SSA)机制,有效促进了多样性上下文特征的学习,并集成了空间和光谱特征。

预训练模型

  • 提供了多种预训练模型,包括 Spatial_MAE 和 Spectral_MAE,分别有 ViT-B、ViT-L 和 ViT-H 三种不同大小的模型权重。

数据集相关实验

  • 在多个高级别和低级别的 HSI 任务中,HyperSIGMA 展示了其优越的表示能力和广泛的适用性,超越了现有的先进模型。
AI搜集汇总
数据集介绍
main_image_url
构建方式
在构建HyperGlobal-450K数据集时,研究团队从全球范围内收集了大量的高光谱遥感图像样本,形成了这一规模庞大的数据集。该数据集包含了超过2000万张三波段图像,显著超越了现有高光谱数据集的规模。这些图像样本涵盖了1701张图像,包括1486张EO-1和215张GF-5B,具有数百个光谱波段,为高光谱图像的深度学习模型训练提供了丰富的数据资源。
使用方法
使用HyperGlobal-450K数据集时,用户可以通过预训练和微调两种方式进行。预训练阶段,用户可以使用SLURM进行大规模的模型训练,如空间ViT和光谱ViT的预训练。微调阶段,用户可以根据具体任务需求,参考提供的README文件进行图像分类、目标检测、变化检测等任务的微调。数据集的模型权重可以通过百度网盘或Hugging Face平台下载,方便用户进行模型的进一步研究和应用。
背景与挑战
背景概述
高光谱图像(HSI)技术在遥感领域具有广泛应用,但其处理过程中存在光谱和空间冗余问题。为解决这一难题,武汉大学联合东京大学、南洋理工大学等机构的研究人员,于2024年创建了全球最大规模的高光谱图像数据集HyperGlobal-450K。该数据集包含超过2000万张三波段图像,旨在通过大规模预训练提升高光谱图像的解析能力。主要研究人员包括Di Wang、Meiqi Hu、Yao Jin等,他们提出的HyperSIGMA模型通过引入稀疏采样注意力机制,有效提升了高光谱图像的特征学习能力,对高光谱图像处理领域具有重要影响。
当前挑战
构建HyperGlobal-450K数据集面临的主要挑战包括数据采集的广泛性和多样性,确保数据质量的同时处理大量数据。此外,高光谱图像处理中的光谱和空间冗余问题也是一大挑战,HyperSIGMA模型通过稀疏采样注意力机制和光谱增强模块来解决这一问题。然而,模型的训练和优化过程复杂,需要大量的计算资源和时间,且在实际应用中如何确保模型的泛化能力和实时处理效率仍需进一步研究。
常用场景
经典使用场景
在遥感领域,HyperGlobal-450K数据集以其庞大的规模和丰富的光谱信息,成为高光谱图像(HSI)分析的经典工具。该数据集广泛应用于图像分类、目标检测、异常检测、变化检测、光谱解混、去噪和超分辨率等任务。通过提供超过2000万张三波段图像,HyperGlobal-450K为研究人员提供了前所未有的数据资源,极大地推动了高光谱图像处理技术的发展。
解决学术问题
HyperGlobal-450K数据集解决了高光谱图像处理中的多个关键学术问题。首先,它通过提供大规模、多样化的数据,有效缓解了数据稀缺性问题,促进了深度学习模型在高光谱图像分析中的应用。其次,该数据集的高光谱分辨率和空间分辨率,为研究光谱与空间特征的融合提供了理想平台,推动了高光谱图像理解技术的进步。此外,HyperGlobal-450K还为多任务学习提供了丰富的数据支持,有助于开发更加通用和高效的高光谱图像处理模型。
实际应用
在实际应用中,HyperGlobal-450K数据集被广泛用于环境监测、农业估产、城市规划、灾害评估等领域。例如,通过分析高光谱图像中的植被指数,可以实现精准农业管理;通过检测城市区域的变化,可以辅助城市规划和土地利用管理;在灾害评估中,高光谱图像可以提供详细的地表信息,帮助评估灾害影响和制定应对策略。这些应用展示了HyperGlobal-450K在实际问题解决中的巨大潜力。
数据集最近研究
最新研究方向
在遥感领域,HyperGlobal-450K数据集的最新研究方向主要集中在高光谱图像(HSI)的智能理解和处理上。该数据集支持了HyperSIGMA模型的开发,这是一个专门为HSI解释设计的基础模型。HyperSIGMA通过引入稀疏采样注意力(SSA)机制,有效解决了HSI中的光谱和空间冗余问题,提升了模型对多样上下文特征的学习能力。此外,HyperSIGMA还集成了光谱增强模块,进一步优化了空间和光谱特征的整合。这些创新使得HyperSIGMA在多种高光谱任务中表现卓越,包括图像分类、目标检测、变化检测等,显著超越了现有的最先进方法。HyperGlobal-450K数据集的广泛应用和HyperSIGMA模型的成功,为高光谱遥感技术的进一步发展提供了坚实的基础和广阔的前景。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

ChinaTravel

ChinaTravel是由南京大学国家重点实验室开发的一个真实世界基准数据集,专门用于评估语言代理在中国旅行规划中的应用。该数据集涵盖了中国10个最受欢迎城市的旅行信息,包括720个航班和5770趟列车,以及3413个景点、4655家餐厅和4124家酒店的详细信息。数据集通过问卷调查收集用户需求,并设计了一个可扩展的领域特定语言来支持自动评估。ChinaTravel旨在解决复杂的真实世界旅行规划问题,特别是在多兴趣点行程安排和用户偏好满足方面,为语言代理在旅行规划中的应用提供了重要的测试平台。

arXiv 收录

中国农村教育发展报告

该数据集包含了中国农村教育发展的相关数据,涵盖了教育资源分布、教育质量、学生表现等多个方面的信息。

www.moe.gov.cn 收录

UAVDT

UAVDT是一个用于目标检测任务的数据集。

github 收录