five

danaroth/salinas|高光谱遥感数据集|地物分类数据集

收藏
hugging_face2023-11-09 更新2024-03-04 收录
高光谱遥感
地物分类
下载链接:
https://hf-mirror.com/datasets/danaroth/salinas
下载链接
链接失效反馈
资源简介:
该数据集由224波段的AVIRIS传感器在加利福尼亚的Salinas Valley收集,具有高空间分辨率(3.7米像素)。数据集覆盖了512行217列的图像区域,并丢弃了20个水吸收波段。数据集包括蔬菜、裸土和葡萄园等16个类别的地面真实数据。此外,还介绍了Salinas-A子场景,包含6个类别。文件还列出了每个类别的样本数量,并提供了数据集的图像示例。
提供机构:
danaroth
原始信息汇总

数据集描述

该场景由224频段的AVIRIS传感器在加利福尼亚州的萨利纳斯谷收集,具有高空间分辨率(3.7米像素)。覆盖区域包括512行和217列。与Indian Pines场景一样,我们丢弃了20个水吸收频段,具体为频段:[108-112]、[154-167]、224。该图像仅作为传感器辐射数据可用。其中包括蔬菜、裸土和葡萄园。萨利纳斯地面实况包含16个类别。

萨利纳斯图像的一个小子场景,记为Salinas-A,通常也被使用。它包括86*83像素,位于同一场景中的[样本,行] = [591-676, 158-240],包含六个类别。

特征

萨利纳斯场景的地面实况类别及其相应的样本数量如下:

# 类别 样本数量
1 Broccoli_green_weeds_1 2009
2 Broccoli_green_weeds_2 3726
3 Fallow 1976
4 Fallow_rough_plow 1394
5 Fallow_smooth 2678
6 Stubble 3959
7 Celery 3579
8 Grapes_untrained 11271
9 Soil_vinyard_develop 6203
10 Corn_senesced_green_weeds 3278
11 Lettuce_romaine_4wk 1068
12 Lettuce_romaine_5wk 1927
13 Lettuce_romaine_6wk 916
14 Lettuce_romaine_7wk 1070
15 Vinyard_untrained 7268
16 Vinyard_vertical_trellis 1807

萨利纳斯-A场景的地面实况类别及其相应的样本数量如下:

# 类别 样本数量
1 Broccoli_green_weeds_1 391
2 Corn_senesced_green_weeds 1343
3 Lettuce_romaine_4wk 616
4 Lettuce_romaine_5wk 1525
5 Lettuce_romaine_6wk 674
6 Lettuce_romaine_7wk 799

快速浏览

Salinas Salinas数据集的样本频段。

Salinas gt Salinas数据集的地面实况。

SalinasA Salinas-A数据集的样本频段。

SalinasA gt Salinas-A数据集的地面实况。

致谢

该数据集最初由Manuel Graña、Miguel-Angel Veganzones、Borja Ayerdi收集。

数据集的原始链接如下:

https://www.ehu.eus/ccwintco/index.php/Hyperspectral_Remote_Sensing_Scenes

AI搜集汇总
数据集介绍
main_image_url
构建方式
Salinas数据集是由224波段的高分辨率AVIRIS传感器在加利福尼亚州Salinas Valley地区采集的影像数据构建而成,其空间分辨率高达3.7米像素。该数据集覆盖了512行217个样本的区域,并去除了20个水吸收波段,保留了可用于分析的波段。数据集包括蔬菜、裸土和葡萄园等不同类型的地面覆盖,并为每个类别提供了详细的地面真实标签信息。
特点
Salinas数据集的主要特点在于其高空间分辨率和丰富的波段信息,为高光谱图像分析提供了丰富的数据资源。数据集包含了16个不同的地面真实类别,每个类别都有相应的样本数量,且包含了一个较小的子场景Salinas-A,便于进行更精细的分析。此外,该数据集提供了地面真实标签,对于监督学习任务尤为宝贵。
使用方法
使用Salinas数据集时,用户可以直接加载影像数据和对应的地面真实标签。数据集的波段信息可用于特征提取,地面真实标签可用于训练分类模型。Salinas-A子场景可作为一个独立的测试集或用于模型验证。用户需注意数据集的版权信息,合法使用数据,并在研究中引用原始数据来源。
背景与挑战
背景概述
Salinas数据集,采集自加利福尼亚州萨利纳斯谷,由224波段AVIRIS传感器捕获,具备3.7米的高空间分辨率。该数据集覆盖了512行217个样本的区域,针对水吸收波段进行了剔除,并以传感器辐射数据的形式存在。数据集包含蔬菜、裸土和葡萄园等地面实况类别,共计16类。Salinas-A子场景也常被使用,包含6类,覆盖了86*83像素。该数据集由Manuel Graña, Miguel-Angel Veganzones, Borja Ayerdi等人收集,为高光谱遥感领域的研究提供了宝贵的资源,对于推动相关技术的发展具有显著影响。
当前挑战
Salinas数据集在研究领域中面临的挑战主要包括:1)如何精确区分具有相似光谱特性的不同植被类别;2)在构建过程中,如何处理大量的高光谱数据,以及如何有效地进行数据预处理和降维。此外,数据集的地面实况标注质量对于模型训练至关重要,因此确保标注的准确性和一致性也是一项挑战。
常用场景
经典使用场景
在遥感领域,danaroth/salinas数据集因其高空间分辨率和丰富的地物类别,常被用于高光谱图像分类算法的研究与验证。该数据集包含512行217列的像素,涵盖蔬菜、裸土和葡萄园等多种地表类型,为算法提供了丰富的学习样本。
实际应用
在实际应用中,danaroth/salinas数据集的应用场景广泛,如在精准农业中,可用于作物识别和健康监测;在环境监测中,可用于土地覆盖类型分类,为资源管理和环境保护提供数据支持。
衍生相关工作
基于danaroth/salinas数据集,研究者们衍生出了众多相关工作,包括改进的高光谱图像处理算法、特征选择技术以及分类模型的优化,这些工作进一步推动了高光谱遥感技术的发展和应用。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录

OpenSonarDatasets

OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。

github 收录

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录

波士顿房价数据集

波士顿房价数据集是一个经典的机器学习数据集,通常用于回归任务,尤其是房价预测。下方文档中有所有字段顺序的描述。

阿里云天池 收录

ChinaTravel

ChinaTravel是由南京大学国家重点实验室开发的一个真实世界基准数据集,专门用于评估语言代理在中国旅行规划中的应用。该数据集涵盖了中国10个最受欢迎城市的旅行信息,包括720个航班和5770趟列车,以及3413个景点、4655家餐厅和4124家酒店的详细信息。数据集通过问卷调查收集用户需求,并设计了一个可扩展的领域特定语言来支持自动评估。ChinaTravel旨在解决复杂的真实世界旅行规划问题,特别是在多兴趣点行程安排和用户偏好满足方面,为语言代理在旅行规划中的应用提供了重要的测试平台。

arXiv 收录